我們的論文分析時經常需要進行一個一般人群的數據基線表的統計分析,一般來說就是SCI論文中的表一,如下圖  表中Q1-Q4為4個亞組,分別描述了每個亞組的均值和標準差,分類變量使用計數和百分比表示,最后還得出組間比較的P值,既往我們已經介紹了使用R語言多個R包繪制基線表,今天我們來介紹一下使用spss拆分文件功能輕松繪制如上圖論文數據基線表。 繼續使用我們的早產數據,我們先導入數據  這是一個關于早產低體重兒的數據(公眾號回復:早產數據,可以獲得該數據),低于2500g被認為是低體重兒。數據解釋如下:low 是否是小于2500g早產低體重兒,age 母親的年齡,lwt 末次月經體重,race 種族,smoke 孕期抽煙,ptl 早產史(計數),ht 有高血壓病史,ui 子宮過敏,ftv 早孕時看醫生的次數,bwt 新生兒體重數值
假設我們研究的是不同種族對低體重而出身率的影響,需繪制不同種族的基線表 選擇:數據----拆分文件  點擊比較組,選入種族,點擊確定  點擊確定后,界面沒有什么變化,但是在SPSS已經默認它分成3組了,接下來我們就可以進行分析了 這里要注意一下,SPSS中分類變量和連續變量要分開進行分析 點擊:分析—描述統計—描述  把連續的變量選入,點擊選項  選入均值和標準差,  點擊確定,得出了每個種族的連續變量的均值和標準差  接下來進行分類變量,點擊:分析–描述統計—頻率  把分類變量選入,點擊統計  選擇4分位數,  得出總的頻率表和單項的百分比表    這樣百分比和均值我們都計算出來啦,最后我們來計算P值,也是需要連續變量和分類變量分別計算。 先來計算連續變量 點擊分析—比較均值—單因素ANOVA檢驗  把連續變量和結果變量填入  點擊確定,得出了F值和P值  接下來計算分類變量的P值 點擊:分析—描述統計—交叉表  填入分類變量和結果變量,點擊統計  選擇卡方  最后點擊確定    到此全部結果已經出來了,看著步驟多,其實思路清晰的話一下就做出來了。原創不易,點個小紅心再走吧。
|