確定調查所需的樣本量,是研究開展的第一步。樣本量的大小直接影響著研究結果的可靠性和推廣性。樣本量過小可能使得研究結果不具備代表性,產生誤導性結論;樣本量過大雖然可以提高估計的準確性,但可能增加研究成本,影響論文寫作進度。因此,如何確定合適的樣本量,便成為論文寫作前需要考慮的關鍵問題。在C刊論文中,樣本量確定主要有經驗法、利用統計學公式手工計算、通過統計軟件計算等方式。以下為大家一一介紹。 一、確定樣本量的經驗法則 利用經驗法確定樣本量,指的是建立在過去抽取滿足統計方法要求的樣本量所累積下來的經驗。使用這個方法時很少需要統計方法知識,但是得出的樣本大小很接近統計方法計算出的結果。 (一)質性研究的經驗樣本量 1.扎根理論研究的訪談樣本量范圍一般在5-35之間。多數扎根理論的訪談樣本量在10~20人。實際上,扎根理論對樣本量沒有特殊的要求,只要達到理論飽和即可。論文寫作模板參考: (1)“基于扎根理論的飽和度檢驗原則,每次訪談后進行編碼整理,并與之前的訪談記錄進行比較,直到不再出現新的概念和范疇為止,最終樣本為……。”(出自《MOOC平臺促進教師專業發展的內在機理——基于中國大學 MOOC平臺16位教師學習者的扎根理論研究》)。 (2)“根據研究目標及主要問題,首先從……(數據源)收集……(樣本特征)的x個樣本;然后,對以上x個樣本的原始資料進行開放性編碼,發現所提取的概念還不夠全面和清晰,難以構建一個完整的遴選體系,因此在現有樣本基礎上,再收集……(樣本特征)的x個樣本,通過提取一些新概念,對相關概念進行完善,直至理論飽和。”(出自《顛覆性技術遴選的指標體系與流程設計——基于扎根理論的多案例研究》)。 (3)“以……(文本)為分析單位,篩選具體標準如下:……(具體標準)。根據以上x個標準,在……(數據源)篩選得到符合標準的樣本x個,而后根據……(篩選標準)最后確定了x個……(樣本特征)樣本。”(出自《基于建構扎根理論的旅游“好玩”評價過程建構》)。 2.案例研究的樣本量范圍在4~30之間。個案研究樣本量一般在5個以內,多案例研究的樣本量在4-10左右。論文寫作模板參考: (1)“根據上述選擇標準和數據收集過程,結合Eisenhardt等提出的多案例研究的樣本量要求,本研究共篩選了x個代表性……(樣本特征)案例”(出自《PPP項目中合作目標互依對團隊績效的影響機制——探索性案例研究》)。 (2)“樣本量的選取是根據個案研究選取的方便性原則決定”(出自《中學生體育競賽憤怒的個案研究:基于解釋現象學分析》)。 (二)量化研究的經驗樣本量 對于探討多個解釋變量與一個被解釋變量間的關系,樣本量一般是解釋變量的5-20倍;對于確定正常值范圍的研究,總樣本量至少在100以上;地區性調查樣本量通常在500-1000,全國性調查樣本量在1500-2500左右。論文寫作模板參考: (1)“為避免樣本量過少導致的模型過度擬合問題,按照樣本量是觀察變量20倍以上的經驗法則,保證樣本量的最低要求。同時,一些擬合指標對樣本量高度敏感,樣本量過大擬合指標容易拒絕模型的零假設。最終抽取有意義樣本x份”(出自《大學生中華文化認同的心理機制與影響因素——基于結構方程模型的實證分析》)。 (2)“最終收集x份有效問卷,滿足實證分析的總樣本量大于100或至少為題項數目5倍的要求。”(出自《國家文獻信息資源保障平臺的用戶滿意度實證研究》)。 二、確定樣本量的統計學方法 (一)樣本量計算的基礎公式 樣本量的計算公式取決于具體的統計問題和假設檢驗方法。根據總體比例是否已知,樣本計算公式可劃分為: 1.總體比例已知的情況下,可以用計算樣本量。其中,n表示樣本量,Z表示置信水平,p表示總體中某一特定屬性的比例,e表示允許的誤差范圍。例如,在《鄉村振興背景下農戶可行信息能力組成要素、評價與對策建議》這篇論文中,作者研究的是農戶可行信息能力,對設置網絡精準扶貧試點的農戶進行抽樣調查。在確定貧困戶的比例時,作者根據已知的數據(全國確立的貧困戶共計9899萬,全國人口13.5億),計算得出貧困戶比例p=0.9899/13.5≈0.07;設置置信區間為95%,對應的Z=1.96;e=±3%,從而計算樣本量n=[1.962*0.07*(1-0.07)]/0.032=277.87≈278。 
2.總體比例未知的情況下,可以用計算樣本量。其中n表示樣本量,Z表示置信水平,σ表示總體標準差,e表示允許的誤差范圍。例如,在《信息成癮測量量表構建與實證研究》這篇論文中,作者研究的是信息成癮問題,對30歲以下的群體進行抽樣調查。由于缺乏對信息成癮群體標準差的估計數據,作者引入變異系數V=標準差σ/平均值X,在不重復抽樣的條件下,樣本量公式可變形為;設置置信區間為95%,對應的Z=1.96;變異系數的保守估計值為0.5;設置相對抽樣誤差為±4%,從而計算樣本量n=(1.962*0.52)/0.042≈600。 
(二)樣本量計算的軟件實現 上面我們介紹了樣本量計算的基礎公式,但這兩個公式使用時存在前提假設,比如它需要滿足樣本量正態分布等,因此當需要明確樣本量的效應大小,樣本分布不可知,或進行多重比較等情況,樣本量計算的基礎公式可能不適用。這個時候我們就需要采用t檢驗、F檢驗、χ2檢驗等其他方法計算樣本量。然而,相比上面兩個公式,這些方法對應的樣本量計算公式更復雜,不易通過手工計算,這個時候統計軟件便派上了用場。常用的計算統計軟件有G*Power、R語言、Stata、SPSS、Pass等,這些軟件都可以根據不同的研究設計、預期效應大小、顯著性水平和功效等因素計算所需的樣本量。這里,我們主要以G*Power軟件示例如何計算樣本量。 G*Power軟件是一款開源免費的專門用于計算統計功效及樣本量的軟件。首先,我們可以在www.gpower.hhu.de官方網址進行下載(如下圖左),解壓文件夾后,雙擊setup.exe進行安裝。G*Power的初始界面如下圖右。 
使用G*Power分析計算分為3步:(1)選擇合適的統計方法;(2)選擇5種統計力分析類型中的1種;(3)輸入分析需要的參數,點擊計算。接下來,我們結合C刊論文常用的t檢驗和F檢驗,示例如何通過G*Power軟件計算樣本量。 1.基于相關系數的t檢驗計算樣本量。《認知和情感共情與負性情緒:情緒調節的作用機制》這篇論文研究的是大學生認知、共情對情緒的影響,作者參考已有研究計算得到的“共情、情緒調節和負性情緒之間的平均相關系數為0.16”,利用t檢驗方法計算樣本量。按照作者在論文中提供的參數,我們在G*Power軟件中選擇t-tests方法,選擇“Correlation:Point biserial model”,之后設置參數Effect size|ρ|=0.16,α=0.05,β=0.8,最后點擊“Calculate”,計算得出Total sample size=301,也即作者在文中呈現的“最小樣本量為301”。 2.基于效應大小的t檢驗計算樣本量。《多目標覺知范式檢驗視覺意識容量》這篇論文研究的是視覺意識容量,作者參考已有研究中“effect size=0.67”,利用t檢驗方法計算樣本量。按照作者在論文中提供的參數,我們在G*Power軟件中選擇t-tests方法,選擇“Means:Difference between two dependent means(matched pairs)”,之后設置參數Effect size dz=0.67,α=0.05,β=0.8,最后點擊“Calculate”,計算得出Total sample size=16,也即作者在文中呈現的“估算結果為16人”。 3.基于統計功效的F檢驗計算樣本量。《人工智能算法推薦會增加消費者的品牌好感嗎?》這篇論文研究的是人工智能算法推薦對消費者品牌好感的影響,作者參考已有研究“將效應規模設置為中等效應值effect size=0.25”,利用F檢驗方法計算樣本量。按照作者在論文中提供的參數,我們在G*Power軟件中選擇F-tests方法,選擇“ANOVA:Fixed effects,omnibus,one-way”,之后設置參數Effect size f=0.25,α=0.05,β=0.8,最后點擊“Calculate”,計算得出Total sample size=128,也即作者在文中呈現的“本研究的樣本數應當達到128以上”。 三、小結 以上是利用經驗法、統計學公式、統計軟件等計算樣本量的方式。經驗法無需計算,按照已有研究的觀點選擇合適的樣本量即可,相對更易操作,但嚴謹性可能會被質疑;而利用統計學公式或統計軟件等計算樣本量,對于不具備量化研究的作者來說,可能有操作難度,但會助力論文寫作的規范性。因此,在選擇樣本量進行抽樣調查之前,寫作者應注意核實樣本量與研究目的是否匹配,且盡可能清晰地展示出樣本量的計算過程。
|