本來我可以起個騷氣一點的名字
但是那樣很無聊,而且我不覺得有趣,我現(xiàn)在想做的就是,如何成為一位優(yōu)秀的稱職的R語言講師。 其實我的目標是,中國會做實驗的臨床醫(yī)生中最優(yōu)秀的R語言老師。 這個是可以完成的。 一維世界比的是長度,二維比的是面積,三維空間比的是體積,我限定了實驗,臨床,R語言這三個維度,已經是很小的世界了。 就跟微博起初限定140字發(fā)言,大部分QQ空間用戶不能理解一樣, 我的課程被限制在3個小時當中,可是3個小時能學啥呢?別人不都是2天48小時的課程么? 最終時間會給出答案,入門R語言,不需要2天,3小時應該夠了 能想象么,學英語到了最后最大的瓶頸是自身母語的水平。 R語言學到最后限制我們的是統(tǒng)計知識和研究背景。 看!
而包的使用就是看看說明,知道他輸入什么數(shù)據(jù),處理什么數(shù)據(jù)就可以了。 但是,輸入的數(shù)據(jù)如何控制,疊加在數(shù)據(jù)上的算法如何選擇,輸出的數(shù)據(jù)如何通俗易懂,這已經超出R語言的范疇,跟我們自身相關。
以Y叔的標準來看,假如你掌握了R語言的操作,你有深厚的背景知識,你是能夠寫出你這個領域大部分包的,至少是重復。 R語言的一大優(yōu)勢就是包多,而包的產生首先是因為懶,程序員寫了幾個函數(shù),但是每次復制粘貼又嫌麻煩,就打包唄, 寫的差的包自己當代碼儲存器用,寫得好的包給大家用。 但是,那些處理的過程,我們并不知道,我自己寫個做TCGA單基因GSEA的包,這里面數(shù)據(jù)的標準化,格式,只有我自己知道,但是恰恰是你做選擇時用到的知識最重要。 買股票的時機很重要,判斷購買時機的知識更重要,跟著別人買很簡單,如果自己做決定,很困難 跟著導師做科研,很簡單,完成手上的事情是最低要求,但是如果自己做科研,一雙手套都要自己掏錢,又很困難
回到R語言的學習,我沒有看過哪個人的R語言是別人教出來的,所有的都是自己學出來的,你遇到一個實際問題,去檢索,得到多個方案,自己該用包就用包, 該寫函數(shù)就寫函數(shù),該調試就調試,最終把問題解決了,這里面R語言的本身起的作用是及其微小的
所以現(xiàn)在問題是,如何在2個小時內把R語言的基礎知識給學員講清楚,用半個小時講一下R包的使用,再用半個小時講一下R語言進階的途徑。 應該就沒有問題了。 但是問題是,
這里面跟語言表達沒有也別的關系,難的是如何做到共情,有一種說法叫做,知識的詛咒,即,一旦掌握了某個知識,就再也回不到沒有掌握前的狀態(tài)(如果是自己忘了,除外)
簡單的原因就是,你忘了自己是如何學會這個技能了,當時你沒有記錄,事后你不關心。 從這一點看過去,教師是個偉大的職業(yè),他要把這些他自己習以為常的技能完整傳授給你,而且是一遍接一遍,一學期接著一學期. 好的老師一定會付出很多心血。 為了做到這件事,我在第一期的時候,認真學習了一套datacamp出的教程,目的就是揣摩別人講課的思路,我去看高級的老師是如何教學的。 而為了今后在R語言高級課程中能夠準確地傳授知識,我今天又開始一套哈佛的教程。 實際上我不應該用R語言高級教程這個詞語,因為所謂高級,只是因為我們自己不滿足現(xiàn)象,試圖去解釋原理。 假如我們以后有了高級課程,你要記住,你不是來學R語言的,你是來開拓眼界的。 這套哈佛教程有完整的并且免費的視頻 Data Analysis for the Life Sciences https://courses./courses/course-v1:HarvardX+PH525.1x+2T2017/b60b30a885934cd5971b6fc620a41657/ 所依賴的數(shù)據(jù)以及書中的代碼在這里 PH525x series - Biomedical Data Science http://genomicsclass./book/ 這套視頻是完全可以把你帶入門的,而且是從入門到高深。 如果你覺得起步太高,可以試試下面的入門資源:我只推薦兩個 第一個是Try R http://tryr./levels/1/challenges/1 這是一個交互教程,可以在不按照任何程序的情況下,入門R,可能要花費2個小時 第二個是 swirl http:///students.html 是一個R包實現(xiàn)的交互教程。 Y叔曾經推薦過 聽說你想學R https://guangchuangyu./cn/2017/07/swirl/ 學習完了上面的課程可以試一下 Data Analysis for the Life Sciences https://courses./courses/course-v1:HarvardX+PH525.1x+2T2017/b60b30a885934cd5971b6fc620a41657/ 也就是剛剛介紹的 對于其中的R語言數(shù)據(jù)處理部分可以看看這本,強烈推薦系列,這本書就是對tidyverse這個神包的注釋 R for Data Science http://r4ds./index.html 如果是生物背景的,必須學習bioconductor的使用 其實剛才那個哈佛系列已經包括了bioconductor,在他的資源推薦里面還有這樣一本書 R & Bioconductor Manual http://manuals.bioinformatics./home/R_BioCondManual 假如要學習R語言繪圖 ggplot2: Elegant Graphics for Data Analysis https://www.amazon.com/dp/0387981403/ref=cmswsu_dp?tag=ggplot2-20 這本書有中文版 生物信息可視化大神Y叔還當過網紅,他有個觀點特別好,圖就是數(shù)據(jù),數(shù)據(jù)就是圖。webinar錄播:plotting tree + data 假如學的差不多了,可以進階一下,我看到謝益輝還有很多大神都會推薦這本書: Advanced R https://adv-r./ 學完那一本,你應該有很多函數(shù),代碼要分享,可以學習一下如何寫包了, Y叔說過,能力到了,寫R包是個自然而然的事情, 希望你也有這一天 R packages http://r-pkgs./ 我介紹的這四本書都是Hadley Wickham大神的,如果你對這個男人有興趣可以看一下這個網頁 Hadley Wickham http:/// ``` 好吧,R語言的資源實在太多,你要有興趣看一下我寫的這個合集 R語言資源匯總 http:///2017/10/17/01Rresource/ |
|