本文首發于 ”百味科研芝士“ 微信公眾號,轉載請注明:百味科研芝士,Focus科研人的百味需求 想研究疾病OS,PFS,DFS? 想研究預后如何制作生存曲線? 百味芝士今日為你盤點幾款生存曲線制作方法。 第一款:Kaplan-Meier Plotter數據庫 ★★★★☆ Kaplan-Meier Plotter數據庫這是今天推薦首款生存曲線制作方法,官網(http:///analysis/),它是長的這個樣子的。 咋一看,Kaplan-Meier Plotter數據庫似乎只能研究6個癌種,小編之前也犯了同樣的錯誤,“pan-cancer”(pancreatic cancer,胰腺癌像不像?)。其實,“pan-cancer”是畫中有畫,不信咱打開瞧瞧! 先看看mRNA表達譜,還有不下20個癌種可供研究,而主頁上面的五個癌種的信息是比較詳細的。同樣,也可以查看miRNA表達譜的“pan-cancer”,包含的癌種也有20種。 Kaplan-Meier Plotter數據庫的數據來源于GEO(僅限Affymetrix微陣列),EGA和TCGA,缺點是每個數據庫每兩年更新一次。走起來~ 點擊癌種“Lung Cancer”,左上的搜索框輸入“KRAS”,默認參數。 下拉頁面,點擊“Draw Kaplan-Meier Plotter”,簡單粗暴,出圖! 最后,我們看看參數設置吧,在“survival”這里可以選擇患者的總生存期(OS)、首次進展生存期(FP)、再次進展生存期(PPS)。而對于隨訪時間的終點也可以設置,在“Survival”菜單下面的“Follow up threshold”里面。
接著,看看其他參數設置,左上角是探針設置,根據自己的研究選擇不同的探針。病理參數里面可以設置病理類型、分級、分期、T、N、M、性別、吸煙史。在治療分組中,也可以看不同治療的預后。而數據集里面也囊括了TCGA以及GEO的芯片數據。最后的COX分析也可以選擇單因素和多因素分析。 通過參數設置,我們可以分析不同亞組、不同病理參數、不同治療模式、不同數據集的患者預后,由此也看出來Kaplan-Meier Plotter數據庫的強大。 第二款:SPSS軟件 ★★★★★ SPSS軟件制作生存曲線是最經典的做法,只要你有數據就能做,就是不熟悉SPSS的孩紙會感覺稍稍復雜。直接上數據吧!假定:分組信息(0低表達;1高表達)、存活狀態death(0存活;1死亡)、生存時間time(月)。 數據錄入完成后,依次點擊分析→生存函數→Kaplan-Meier 參數設置:time-時間,death-狀態,點擊定義事件(終點時間設置為1死亡) 設置檢驗統計量:對數秩、Breslow 選項里面點擊生存函數 直接出圖!當然,這個圖在SPSS中可以進行簡單修改,可以試一試!
第三款:GraphdPad Prism軟件 ★★★★☆ GraphdPad Prism軟件是一款超級好用的專業醫學繪圖軟件,在醫藥生物領域被廣泛使用,擁有ROC曲線分析、Bland-Altman分析功能以及GraphPad Prism的線性/非線性擬合功能,所以,制作生存曲線對它來說只是小菜。 首先,錄入數據,注意它與SPSS的輸入區別,即實驗組(EXP)和對照組(CON)輸入在不同的兩列中。 點擊Graphs中的Data 1,右側即顯示制作好的生存曲線。 調色:鼠標雙擊其中一條曲線,更改顏色后點擊OK。 下面是更換顏色后的圖,看著還不錯~ 圖還行,貌似缺點東西,P值!點擊菜單欄中“Analyze”,選擇“survival curve”,然后點擊OK。 直接查看P值及其他數據。相比SPSS來說,略顯麻煩,但是對圖形的修改,還算不錯,有機會下次為大家推送GraphdPad Prism。
第四款:UALCAN網站 ★★★★★ UALCAN(http://ualcan.path./index.html)主要是基于TCGA數據庫中的相關癌癥數據進行分析的網站,操作仍然是簡單粗暴,先看主頁。 開始表演了~抖一下“Analysis”,方框里面根據需要更改。 點一下“Explore”,繼續點“Show all gene expression in same page”,別停!接著點“Survival”,完事兒! 話說這圖出的真驚喜,連續好幾張(不試后悔)!必須給五星!
第五款:GEPIA網站 ★★★★★ GEPIA在百味里面推送過~,官網(http://gepia./) 收索框中輸入基因,點擊“Survival Analyze”。 跳轉頁面,在下圖紅框里面選擇一個腫瘤患者數據集,比如“LUAD”。 點擊下方“Plot”,出圖~666。
第六款:cbiportal網站 ★★★★★ 這個網站(https://www./)大家太熟悉了,不再多說!點擊鏈接直接查看推文:懶人如何分析TCGA數據之cBioportal網站。第七款:Oncolnc網站 ★★★★★ 既然是“Party”,那就再來介紹一個網站好了!OncoLnc,也是一款基于TCGA數據預后分析網站,官網網址:http://www./。
輸入基因名:可以是基因名,也可以輸入mRNA,microRNA和lncRNA。 點擊“Submit”后,查看結果~頁面如下,顯示了腫瘤類型、回歸系數、P值、基因表達水平等參數。 比如選擇肺腺癌后,點擊“Yes Please!”在這個頁面比如選擇低位4分位和高位4分為的表達量,也就是25:25,當然,也可以選擇50:50也就是取中位數。 點擊提交,生存曲線就做好了,直接導出PDF保存。 下拉頁面,保存生存分析的數據,分析結束。
第八款:R軟件 ★★★★☆ R語言做生存曲線作為今天的壓軸方法,在這里以TCGA數據庫中的數據為例,分析差異基因表達情況與患者的生存關系。 首先用hash函數從矩陣normalizeExp.txt中提取TOP2A的基因表達量。 將基因表達量與生存文件time文件整合 survival函數制作生存曲線 出圖~學會了嗎?
縱觀這些軟件或數據庫,都各有千秋,根據需要,可以任意選擇。小編今天總結了常見的制作生存曲線的八種方法,然而,制作生存曲線的方法遠不止這些,小伙伴們,跟帖吧~
|
|