科學常識與素養是公民素質的重要組成部分,反映一個國家或地區的軟實力,從根本上制約著創新能力的提升和社會經濟發展。英國劍橋大學教授蘇斯倫德(William J. Sutherland)等在《自然》雜志2013年第503卷21期上提出“解讀科學觀點時應該知道的20個事實”,閱后發現其中提到的科學事實都與統計思維有關。現代科學研究中統計學是最重要的工具之一,英國著名生物學家高爾頓曾說過:“統計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統計學可以幫助他們打開一條通道。”當然,統計也很容易被誤用或濫用,《自然》雜志2014年第506卷13期刊發評論《數字危機》,宣稱“很多研究者缺乏統計學基本知識,普遍存在統計誤用現象,在一些基礎科學領域這種情況十分嚴重”。所以,運用科學研究結論輔助現實決策時,須具備良好的統計思維,才能對科學結論保持清晰認識,更準確地解讀結論背后的科學真相。 蘇斯倫德等教授認為將科學結論應用于政策分析,目前仍存在許多嚴峻的問題,當務之急是要讓政策制定者認識到科學那不完美的本質,具備解讀科學結論的能力。鑒于此,與科學打交道的各界非專業人士,在根據相關研究結論制定政策時都需要知道20個基本事實。 事實差異和偶然都會引起變化 現實世界的變化是不可預測的,而科學竭力探究是什么因素造成這些變化,譬如為什么現在比過去十年更熱?等等。對于這些現象的科學解釋,最大挑戰是從無數可能因素中梳理出我們感興趣的過程所起到的作用。 沒有絕對準確的測量 事實上,所有測量都存在誤差,每一次重復試驗都可能得到不同的結果。在某些情況下,與實際變化相比測量誤差也許會很大。提出結論時應該給出結果的誤差范圍,以避免對精確度的不合理判斷。 偏倚是很普遍的 實驗設計或測量裝置可能對結果造成影響,容易在某一特定方向上產生非典型結果。樣本的構成不同,可能得到不同的結果。那些“統計上顯著”的結果更可能被報道和出版,只看文獻易讓人產生錯覺——問題的嚴重性或方案的有效性往往被夸大。 樣本量通常越大越好 大樣本得到的觀測結果往往比小樣本更穩定,這一點對那些變量多、容易產生測量誤差的復雜體系尤為重要。譬如,藥物測試中為了更可靠、準確地估計藥物的平均功效,一個有數以萬計樣本量的實驗要比一個只有數百個樣本量的實驗好得多。 相關不一定意味著因果 相關關系的得出有時候是出于偶然,看似存在的相關關系可能是由復雜的或潛在的第三方因素所導致。譬如,生態學家曾一度認為有毒的藻類殺死了一條河流入海口處的魚,但后來發現是因為魚死了所以藻類繁盛起來。 均值回歸效應可能造成誤導 單次測量中有一部分極端數據是由于偶然或誤差造成的,另一次測量中數據可能就沒有那么極端。比如,在經常發生車禍的地方放置一個測速相機,隨后事故率的下降并不能歸因于放了測速相機,只是事故率回歸到正常水平而已。 超越數據范圍的推斷存在風險 某一范圍得到的模型如果超出這個范圍可能就不再適用,譬如如果現在的氣候變化速度比現存物種在進化史中所經歷過的任何時期都要快,或是出現一個全新的極端天氣系統時,評價生態系統對于氣候變化的反饋就十分困難。 注意基礎比率謬誤 一個不完美的檢驗到底有多準?不僅與檢驗的好壞有關,還與檢測狀態本身發生的概率有關。譬如,一個人做了有99%準確度的血液測試來檢測一種罕見疾病,結果雖呈陽性,但受基礎比率的影響他健康的可能性比生病的可能性更大。 對照組很重要 對照組可以幫助科學家確保沒有額外的因素在干擾結果,沒有對照組就難以知道實驗處理究竟對結果有沒有影響。有時人們在藥物測試中表現出陽性,可能受到環境、提供測試的人甚至藥丸顏色的影響,此時設置對照組(安慰劑組)非常重要。 隨機化能夠避免偏倚 實驗應盡可能隨機地采集樣本。例如,直接比較有參與健康計劃的家庭和沒有參與健康計劃的家庭中孩子的學習成績,很容易帶上偏倚(受教育程度較高的家庭更可能參與健康計劃),好的實驗設計應當隨機地選擇參與或不參與的家長。 尋求“重復”而非“偽重復” 在多個研究、獨立總體中重復出現的結論更為可靠,如果直接把在某一總體中得到的實驗結果推廣到其他不具有相同特點的總體,就犯了“偽重復”的錯誤,偽重復導致研究者對結果產生虛假信心。 科學家也是人 科學家也從工作中獲得一些既得利益,包括地位、研究經費甚至是直接的經濟利益,這可能導致研究結論的刻意選擇與夸大。同行評價并非絕對可靠,期刊編輯可能更支持積極、富有新聞價值的結果。多渠道、獨立來源的數據及可重復結果才更可信。 顯著性很重要 統計顯著性表示一個事件出于偶然而發生的概率,科學家習慣將P<0.05的情況稱為顯著。比如一項實驗中實驗組與對照組的差異顯著性是P=0.01,表示有百分之一的可能性是:實驗處理其實沒有效果,只是偶然因素導致了實驗組和對照組的差異。 不顯著不代表沒效果 統計上不顯著(P>0.05)并不代表真正的無效,只意味著影響效應未被檢測到而已。譬如用基因改造的抗蟲棉和抗蟲馬鈴薯做一組實驗顯示,這些作物對傳粉者等益蟲不存在不利影響,事實可能是實驗的樣本量不夠大,不足以檢測到影響效應。 “效應量”很重要 顯著性可以衡量差異是“真”還是“假”,但如果差異是“真的”,還需進一步考察具體效應有多大?一項多次重復的實驗也許得到統計上顯著、效應量很小的結果,這種結果可能并沒有實際意義。 “關聯性”限制結論的推廣 科學研究結論能否應用于實際問題,取決于研究條件和實際情況的相似程度。譬如,如果將從動物實驗或實驗室實驗中得到的結果推廣到人類的時候,就存在較大的局限性。 感覺會影響風險感知 很多因素都對人類的風險感知造成不同程度的影響,包括事件的罕見性、人們自以為對事件的掌控程度、結果的不利影響等。比如,美國人往往嚴重低估在家攜帶手槍的危險(縮小100倍),而嚴重高估住在核反應堆旁邊的危險(擴大10倍)。 相關性會改變風險 計算獨立事件的后果較為容易,像極潮、強降水和關鍵員工的缺席等,但如果這些事件相互關聯(風暴導致高水位,而強降水導致關鍵員工的缺席),它們共同發生的概率就比預期大得多。 數據可以選擇性呈現 有時為了支持自己的觀點,實驗者會選擇對預期結果有利的證據。譬如,一項研究認為懷孕時的酸奶攝入量和后代患哮喘之間顯著相關,解讀結論首先要知道研究者是預先打算驗證這一假說,還是從一大堆數據中偶然發現這一相關性的。 極端測量值可能引起誤導 極端測量值可能引起誤導。由于個體能力差異、取樣、偏見、測量誤差等因素的影響,所有測量結果都具有可變性。在解釋研究結果的時候,除個體差異之外的因素常被忽略,如果討論的是極端結果,僅比較極端值和平均值的偏離幅度,就可能帶來嚴重的誤導。 上述20個科學事實,基本上都與統計常識有關,可見在開展科學研究、理解研究結論以及利用科學結論指導現實決策的過程中,需要具備一定的統計思維,如此才能避免統計陷阱和統計謬誤。正如C·R·勞教授所講:“對統計學的一知半解,常常造成不必要的上當受騙;對統計學的一概排斥,往往造成不必要的愚昧無知。” 統計思維對于理解科學事實的重要性科學研究的特征之一是理論體系的邏輯性,從假設到理論再到推論,一定要有邏輯性,而且理論必須能夠解釋現實,即理論與現實要有一致性。檢驗理論與現實之間的一致性,通常是統計學的工作,統計學家在其中扮演著重要角色,包括幫助設計收集數據的方法,提供數據特征的描述方法,以及利用樣本數據對總體特征做出估計、檢驗和預測。 現代社會從信息不足轉變為信息泛濫,信息匱乏的危機讓位給信息甄別的困難,如此背景下科學方法成為每個人的必修課。在日益依賴數據的今天,樹立正確的統計思維,才能有效地開展數據處理與分析。邏輯思維往往隱含一定的前提條件,即使邏輯思維過程非常正確,如果前提條件不滿足或者錯了,得到的結論可能與現實不符,所以需要利用統計方法來對研究結論進行經驗驗證。當今世界正步入信息爆炸的大數據時代,統計越顯重要,驗證了英國科幻小說作家H·G·威爾斯的預言:“統計思維總有一天會像讀寫一樣,成為一個有效率公民的必備能力。” 從隨機性中尋找規律性,是統計的基本思想,也是統計的魅力所在。統計學被廣泛應用于各門學科之中,從自然科學到人文社會科學,甚至是工商業及政府的情報決策。作為認識自然、社會的工具和手段,統計研究客觀現象的數量關系,幫助政策制定者理解科研證據對決策的作用。正如現代統計學的奠基人費歇爾所講:“給20世紀帶來了人類進步的獨特方面是統計學,統計學的普遍存在以及在開拓新知識領域方面的應用已遠遠超過20世紀內的任何技術或科學發明。”(李金昌,2009) 馬寅初曾說:“學者不能離開統計而究學,實業家不能離開統計而執業,政治家不能離開統計而施政。”統計思維是在獲取數據、從數據中提取信息、論證結論可靠性等過程中表現出來的一種思維模式,對于人類提高認知起到巨大的作用。無論是解開自然奧秘的科學調查,或是考查早期匿名文學作品的作者、給出考古文物的時間年表,或是解決法庭爭端以及做出最佳決策等,統計思維都起到不可替代的重要作用。 統計學是一種由經驗到理性的認識,是一種運用偶然發現規律的科學。它不只是一種方法或技術,還含有世界觀的成分——看待世界上萬千事物的一種方法,人們常講某事從統計角度看如何,指的就是這個意思。統計思維的養成不但需要學習一些具體的指示,還要能夠從發展的眼光,把這些指示連綴成一個有機的、清晰的圖景,獲得一種歷史的厚重感(陳希孺,2002)。正如德國的斯勒茲曾講道“統計是動態的歷史,歷史是靜態的統計。” 從統計學的角度看,人們從經驗或實驗中所獲取的知識是含有不確定性的,統計關注的是這種知識當中所含不確定性的度量問題,一旦能得到不確定性的量度,人們的知識就得到擴充,對世界的認知就朝前跨越,這個過程在人類知識積累的進程中不斷重復。所以,C·R·勞教授總結道:“在終極的分析中,一切知識都是歷史;在抽象的意義下,一切科學都是數學;在理性的基礎上,所有的判斷都源于統計學。” 透過統計思維理解科學事實的應有態度統計方法作為一種實證主義的方法,目的是從偶然性中發現必然性,對真理做出探究。當今,在人類活動努力的一切范圍內,統計學已經成為一種萬能的、強有力的和不可缺少的研究工具(C·R·勞,2004)。統計作為探求真理的一種手段、工具,其效果如何還取決于運用的過程。 現實中源于多種原因,存在對統計有意或無意的誤用、濫用,從而造成了一些統計陷阱。達萊爾·哈夫在《統計陷阱》一書中展示了各種利用統計陷阱,如今經濟和社會實證分析中對統計數據的“斷章取義”和片面使用成為較普遍的現象(朱玲,2002)。無論是對自然現象還是人文社科現象的分析研究,隨便提出幾個例子和片面尋找幾個數據以佐證某種事物優于另一種事物的研究方式,不僅違背統計學研究方法中系統性原則,也與一般科學研究的方法論背道而馳。面對眾多的統計謊言與陷阱,如何煉就火眼金睛?達萊爾·哈夫在書中提出識破統計陷阱的方法,即對統計資料提出五個問題:誰說的?他是如何知道的?遺漏了什么?是否有人偷換了概念?這個資料有意義嗎?通過尋找這5個問題的答案,讀者能夠初步確定統計資料是否真實可信。 首先,數據采集及整理時要特別注意數據質量問題,避免操作失誤和人為篡改,防止由錯誤的數據引出荒謬的結論。如果原始數據的質量有問題,統計分析只能是“垃圾進,垃圾出”。應用研究學者須對數據質量有一個清醒的判斷,考慮到數據質量對實證結果可能產生的影響。數據處理必須通過嚴謹細密的數據錄入、預處理、分析和檢驗工序構筑基礎,加強過程的質量控制,否則即使擁有再高超的統計技巧,也難免會不自覺地制造出統計謊言。 其次,根據研究目的,結合數據的類型及特點,選擇合適的統計方法。開展統計分析之前,必須認真考慮研究的主要目的是什么,希望解決什么問題,有哪些待檢驗的基本假設;分析過程中應針對資料類型和具體問題,從現有的方法庫中選擇合適的統計方法,如果現有方法不能滿足要求,可以根據實際需要開展方法上的創新。 最后,不輕信自己的分析結果,多用常識和業務知識去檢驗。很多時候,統計分析方法都含有一些潛在的假設條件,實際分析過程中往往被忽略,故不要輕信統計分析結論,尤其是不能給自己的分析結論牽強地尋找理由!統計分析不能脫離背景知識和客觀規律,如果得到與理論預設相反的統計結果,應回頭檢查自己的假設條件,更深入地多方論證,而不能為了證明預先設想而擺弄統計游戲。 此外,統計結果的發布要全面、真實,而不能利用一些統計技巧隱藏真實的結果、有選擇性地給用戶以假象和誘導。 為達到對事物的全面、正確的科學認識,還應把以統計學為主的實證方法與規范方法結合起來使用。以規范分析為基礎,才能保證統計等實證方法應用的有效性和適用性;實證分析的結果也只有進一步利用規范方法加以深入分析和研究,才能充分闡明數字背后科學含義和價值判斷。 ( (轉自:中國統計雜志;作者:程開明;) |
|