讀《概率統(tǒng)計(jì)超入門(mén)》及《萬(wàn)萬(wàn)沒(méi)想到之最簡(jiǎn)單概率論的五個(gè)智慧》
轉(zhuǎn)載
2016-09-22 15:21:58
《概率統(tǒng)計(jì)超入門(mén)》是我在網(wǎng)上淘書(shū)時(shí),發(fā)現(xiàn)的已絕版的原版拓印版。這本書(shū)是2001年日本的兩位教育家寫(xiě)的,和《給討厭數(shù)學(xué)的人——數(shù)學(xué)的奧妙與生活》一樣,都是在日本教育部進(jìn)行一次大的基礎(chǔ)教育改革,推行“愉快教育”旗號(hào)時(shí)推出的。所不同的是,前者發(fā)揚(yáng)了愉快教育的精神,真的把枯燥難懂的概率學(xué)寫(xiě)得非常淺顯易懂,而后者則是擔(dān)憂(yōu)民眾從此失去對(duì)數(shù)理的興趣,遠(yuǎn)離真知而寫(xiě)的一本科普書(shū)。在此感慨一下日本教育界大家的寫(xiě)作功底,和實(shí)踐自己理念的精神。 《概率統(tǒng)計(jì)超入門(mén)》除了由淺入深、結(jié)合日常實(shí)例等特點(diǎn)外,給人最大印象的是每一節(jié)內(nèi)容都是兩頁(yè)。這讓沒(méi)有很大動(dòng)力學(xué)習(xí)的人也能很輕松的持續(xù)看下去,就好比想鍛煉的人應(yīng)該從每天做一個(gè)俯臥撐開(kāi)始,而不是上來(lái)就做二三十個(gè)。?“循序漸進(jìn)、持之以恒”在大多數(shù)情況下都是一個(gè)好原則。 書(shū)中講的東西都很淺顯,把有關(guān)概念和公示抄錄下來(lái),在筆記本上?也只有6頁(yè)。把概念都羅列出來(lái),分別有重復(fù)隨機(jī)試驗(yàn)的二項(xiàng)式分布公式、期望值、方差、標(biāo)準(zhǔn)差、散布度、契貝曉夫定理(又稱(chēng)切貝雪夫定理,這一節(jié)百度了三天才看懂)、協(xié)方差、相關(guān)系數(shù)、線(xiàn)性回歸、多個(gè)隨機(jī)變量的期望值、方差的和差積的計(jì)算,二項(xiàng)式分布的期望值和方差、超幾何分布。這些名詞看起來(lái)很專(zhuān)業(yè),其實(shí)平均每一個(gè)都只需要花5分鐘就能理解。看這本書(shū)時(shí)和印象中的中學(xué)概率統(tǒng)計(jì)有很多不同,感覺(jué)這本書(shū)的內(nèi)容更側(cè)重實(shí)用,更像是數(shù)據(jù)分析的基礎(chǔ)入門(mén)教材。 其實(shí)如何計(jì)算概率和隨機(jī)變量的屬性及相關(guān)性,對(duì)不打算從事金融、商務(wù)分析、人工智能這些行業(yè)的人來(lái)說(shuō)并不重要,但是理解概率的概念,擁有概率統(tǒng)計(jì)的思維卻是非常重要的一件事。萬(wàn)維剛在《萬(wàn)萬(wàn)沒(méi)想到》中甚至說(shuō),概率論是比萬(wàn)有引力和基因復(fù)制更重要的知識(shí),是?現(xiàn)代公民的必備常識(shí),有沒(méi)有這種思維,直接決定一個(gè)人的“開(kāi)化”程度。這個(gè)話(huà)雖然聽(tīng)起來(lái)有些危言聳聽(tīng),但事實(shí)確實(shí)如此。概率論的重要性主要體現(xiàn)在經(jīng)濟(jì)學(xué)的相關(guān)領(lǐng)域里,說(shuō)白了就是跟錢(qián)有很大關(guān)系。相信每一個(gè)從不懂到看懂概率論的人都會(huì)感慨:“要是早點(diǎn)學(xué)就好了”。概率論的思維最大的用處,就是可以讓我們避開(kāi)社會(huì)上的一些“坑”,以保護(hù)好自己的財(cái)產(chǎn),避免繳納“智商稅”。 簡(jiǎn)單記錄一下《萬(wàn)萬(wàn)沒(méi)想到》中關(guān)于概率的這篇文章《最簡(jiǎn)單概率論的五個(gè)智慧》。 第一個(gè)智慧:隨機(jī)。概率論最基礎(chǔ)的思想是,有些事是無(wú)緣無(wú)故發(fā)生的,這就是隨機(jī)的概念。我們總是習(xí)慣性的把一件事情的發(fā)生,歸結(jié)為各種原因?!粳F(xiàn)代認(rèn)知科學(xué)發(fā)現(xiàn),因果關(guān)系是人類(lèi)認(rèn)識(shí)外界的基本機(jī)制,失去邏輯人類(lèi)的認(rèn)知系統(tǒng)就會(huì)崩潰。這就為認(rèn)識(shí)隨機(jī)性造成了難度,其實(shí)在隨機(jī)性背后還有一個(gè)更深的哲學(xué)理論,叫非連續(xù)性?!?比如考試考的好,可以理解為學(xué)習(xí)用功了;比賽失敗,可以理解為實(shí)力不濟(jì)或者球員不在狀態(tài)。但是并非任何時(shí)候事物都是必然的,偶然性也會(huì)造成很大影響。最極端的就是彩票:在同一期里買(mǎi)了相同數(shù)量彩票的人,中獎(jiǎng)的概率是一樣的,無(wú)論你在之前做過(guò)多少努力,比如研究彩票走勢(shì)、沐浴更衣、燒香拜佛還是積善行德,都不會(huì)影響中獎(jiǎng)的真實(shí)概率。像彩票這樣的叫做獨(dú)立的、隨機(jī)的事件,它們的發(fā)生沒(méi)有任何緣由,跟任何事物都沒(méi)有因果關(guān)系。生活中絕大多數(shù)事情是偶然和必然的結(jié)合,我們?cè)谂φ莆毡厝恍缘耐瑫r(shí),也應(yīng)該認(rèn)識(shí)到偶然性的存在,不應(yīng)該把過(guò)多的精力花在尋求偶然因素上面。比較重要的一點(diǎn)啟示是,在評(píng)判一個(gè)人時(shí),不應(yīng)該用一時(shí)的好壞或成敗來(lái)給他貼標(biāo)簽(西方社會(huì)直接有“do not judge”不要評(píng)判一個(gè)人的文化);在尋找成功方法時(shí),更要分清楚別人的成功里存在哪些必然和偶然因素,避免盲目尊崇和不以為然,更加理性的看待事物。 第二個(gè)智慧:誤差。偶然性永遠(yuǎn)存在,哪怕在極度嚴(yán)謹(jǐn)?shù)奈锢韺?shí)驗(yàn)中,也無(wú)法保證完全沒(méi)有偶然影響,而只能通過(guò)多次實(shí)驗(yàn)取平均值的方法,用范圍值來(lái)表示實(shí)驗(yàn)結(jié)果,盡量降低偶然因素的影響。即便如此,實(shí)驗(yàn)結(jié)果也并不代表真實(shí)的值就一定在標(biāo)明的范圍里面,其實(shí)這個(gè)范圍也只是在概率上的計(jì)算結(jié)果而已,只能說(shuō)明真實(shí)值落在范圍外面的可能性很小。誤差不可避免,通過(guò)多次試驗(yàn)、或者多組數(shù)據(jù)來(lái)考量必然性與偶然性,是一個(gè)很重要的科學(xué)思維。比如世界杯預(yù)選賽時(shí),國(guó)足總是在失敗以后強(qiáng)調(diào)客觀因素,這些客觀因素確實(shí)是影響結(jié)果的偶然因素,但多次失敗以后,我們還是可以得出國(guó)足是一支弱隊(duì)的結(jié)論。 第三個(gè)智慧:賭徒謬誤。從這里就開(kāi)始教大家識(shí)別“坑”了。所謂的賭徒謬誤,就是賭徒在賭博時(shí),如果多次出現(xiàn)某一種情況,那他就認(rèn)為沒(méi)有出現(xiàn)過(guò)的情況在后面出現(xiàn)的幾率會(huì)更大。比如扔色子時(shí),已經(jīng)好幾次“大”了,那他就認(rèn)為后面應(yīng)該壓“小”。這種思維是絕大多數(shù)人的習(xí)慣思維,也是人的本能思維。因?yàn)槿四X的機(jī)制就是認(rèn)為萬(wàn)事萬(wàn)物都有聯(lián)系,(有趣的是,小孩子認(rèn)為萬(wàn)物有靈,任何東西都是有生命的,比如汽車(chē)要加油了,他們會(huì)認(rèn)為汽車(chē)開(kāi)的累了要休息。所以人的天性里存在因果關(guān)系。)?只有通過(guò)習(xí)得抽象概念才能跳出這個(gè)偏誤。賭徒謬誤的錯(cuò)誤在于,他們認(rèn)為概率是平均分布的,前面少的后面就會(huì)補(bǔ)回來(lái)。他們沒(méi)有理解“獨(dú)立”和“隨機(jī)”這兩個(gè)概念。所謂“獨(dú)立”,就是前后兩次事件之間沒(méi)有任何關(guān)聯(lián),每一次發(fā)生的概率都是一樣的?!半S機(jī)”則是單獨(dú)一次事件發(fā)生的可能性在理論上是等于概率的,但真的會(huì)不會(huì)發(fā)生是沒(méi)法預(yù)測(cè)的。概率統(tǒng)計(jì)中有一個(gè)“大數(shù)定律”,大數(shù)定律確實(shí)說(shuō)概率是均勻分布的,但有個(gè)前提是實(shí)驗(yàn)次數(shù)要足夠多。所謂足夠多就是無(wú)限多,幾百幾千幾萬(wàn)次都稱(chēng)不上足夠多,幾萬(wàn)次以后的結(jié)果也只是“接近概率分布”。因此大數(shù)定律是一個(gè)理論情況,它的含義是前面如果已經(jīng)扔出了很多次“大”,那再扔很多很多次以后,會(huì)出現(xiàn)非常多的“大”和非常多的“小”,以至于前面出現(xiàn)的幾次“大”被忽略不計(jì)了。 第四個(gè)智慧:不由自主的找規(guī)律(原文是在沒(méi)有規(guī)律的地方發(fā)現(xiàn)規(guī)律)?。概率論的核心在于,獨(dú)立隨機(jī)事件的發(fā)生是沒(méi)有規(guī)律和不可預(yù)測(cè)的。我們沒(méi)有必要為偶然發(fā)生的事情過(guò)于在意,也不應(yīng)該試圖在隨機(jī)中尋找規(guī)律。彩票分析學(xué)大行其道了很多年,大街小巷的彩票售賣(mài)店里都會(huì)有過(guò)去開(kāi)獎(jiǎng)的趨勢(shì)圖,各大網(wǎng)站也都有所謂的彩票分析專(zhuān)家,預(yù)測(cè)未來(lái)的彩票走勢(shì)。在有概率思維的人看來(lái),想要預(yù)測(cè)彩票走勢(shì)是一件非常可笑的事情,這跟預(yù)測(cè)股票走勢(shì)本質(zhì)上是不同的,因?yàn)椴势睕](méi)有任何外界因素可以考量,是一個(gè)純粹的獨(dú)立隨機(jī)事件。賭徒謬誤的問(wèn)題在于分不清大數(shù)和小數(shù)的區(qū)別,彩票分析學(xué)的問(wèn)題則在于,人們認(rèn)為彩票存在走勢(shì),即規(guī)律。其實(shí),發(fā)現(xiàn)規(guī)律也是人的一種天性和本能,人無(wú)時(shí)無(wú)刻不在把外界的信息總結(jié)成一些抽象的規(guī)律以便記憶,人腦在這方面的強(qiáng)大,以至于會(huì)讓人只看到自己想看的東西,忽視不想看和不想知道的東西,如果有不符合規(guī)律的情況,就會(huì)被歸結(jié)為“意外”,甚至是方法不對(duì)、只可意會(huì)、個(gè)人修行之類(lèi)玄而又玄的原因,(這是一個(gè)很有用的心理常識(shí),比如人永遠(yuǎn)喜歡奉承自己的話(huà),哪怕非常清楚對(duì)方只是在奉承自己,而總是不喜歡聽(tīng)到反對(duì)自己的意見(jiàn),哪怕明知道對(duì)方出于好意。)這是主觀上的原因??陀^的原因是,如果數(shù)據(jù)量足夠多,總是能找出一個(gè)看起來(lái)合理的規(guī)律,就好比天上飄著的云,我們總是能找出一片云像某種物體,還越看越逼真。 第五個(gè)智慧:小數(shù)定律。數(shù)據(jù)多的時(shí)候規(guī)律總是會(huì)被找到,而當(dāng)數(shù)據(jù)少的時(shí)候,規(guī)律有時(shí)候會(huì)自己“跳出來(lái)”。隨機(jī)現(xiàn)象可以看上去很不隨機(jī),甚至非常整齊。這個(gè)很好理解,兩個(gè)點(diǎn)連成一條直線(xiàn),你可以說(shuō)這兩個(gè)點(diǎn)就在這條直線(xiàn)上;三個(gè)點(diǎn)則必然會(huì)有一個(gè)三角形;四個(gè)點(diǎn)......永遠(yuǎn)都能有一個(gè)自洽的結(jié)論,說(shuō)明幾個(gè)點(diǎn)構(gòu)成一個(gè)圖形,但實(shí)際上點(diǎn)在不在圖形上,沒(méi)有相關(guān)性,也就是因果關(guān)系。小數(shù)定律是諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)丹尼爾.卡尼曼戲稱(chēng)的,他認(rèn)為理解小數(shù)定律和理解大數(shù)定律是相輔相成的。這跟前面的賭徒謬誤的意思差不多,在生活中是最容易被忽視而造成可笑錯(cuò)誤。比如,你曾經(jīng)被河南人騙過(guò),又恰好聽(tīng)說(shuō)自己的一個(gè)朋友被河南人騙過(guò),如果你進(jìn)一步在網(wǎng)上發(fā)現(xiàn)有人被河南人騙過(guò),那是否就會(huì)得出河南人騙子特別多的結(jié)論?(以前我就是這么認(rèn)為的,無(wú)知啊?。┛墒菬o(wú)論從理論分析,還是從相關(guān)實(shí)驗(yàn)研究來(lái)看,都找不到河南人騙子多的統(tǒng)計(jì)數(shù)據(jù),說(shuō)明這只能是一種以訛傳訛的認(rèn)知偏誤。很多網(wǎng)絡(luò)上的經(jīng)濟(jì)、政治評(píng)論員,經(jīng)常會(huì)從一兩個(gè)事件就總結(jié)出一條博人眼球的規(guī)律來(lái),在“開(kāi)化”人看來(lái),這種行為都是很無(wú)知的。 要理解隨機(jī)分布不等于平均分布,概率和單個(gè)事件是否發(fā)生沒(méi)有直接聯(lián)系,是需要耐下心來(lái),學(xué)一點(diǎn)概率知識(shí)的。這花不了多長(zhǎng)時(shí)間,也許只要一個(gè)小時(shí),我們就能理解大致的概念,然后在生活中慢慢實(shí)踐,鞏固和深化概率論的思維。這對(duì)我們的生活會(huì)產(chǎn)生非常大的幫助,我最近的就碰到這樣一個(gè)事例。有個(gè)朋友建議我關(guān)注一下分級(jí)基金,可能是分級(jí)基金在去年這波股市大行情里比較搶眼吧,肯定有不少私募關(guān)注這個(gè)東西。于是我秉著學(xué)以致用的理念,在網(wǎng)上百度了分級(jí)基金的概念,又找了幾篇講解分級(jí)基金套利的文章,結(jié)果發(fā)現(xiàn)并沒(méi)有大家傳言的那么神奇,也絕對(duì)不是一個(gè)容易賺錢(qián)的投資品。我從兩個(gè)方面得出結(jié)論,一是投資分零和與正和博弈,如果是零和博弈,要想賺取利潤(rùn)就是火中取栗,需要比絕大部分競(jìng)爭(zhēng)者更高的信息獲取能力和分析能力,還有更低的交易成本和渠道工具,很明顯我沒(méi)有。而且更有趣的是,分級(jí)基金的真實(shí)情況是,投資者出于套利的目的會(huì)高頻交易,資管方的主要收入來(lái)源就變成了申購(gòu)和贖回的手續(xù)費(fèi),那就連零和博弈都算不上了,是負(fù)和博弈。另一方面就是從概率角度出發(fā),思考套利的可能性和幾率大小,發(fā)現(xiàn)幾篇所謂的教學(xué)文章在風(fēng)險(xiǎn)衡量和計(jì)算母基金倉(cāng)位時(shí),完全是靠猜的,作者很明顯不懂小數(shù)定律,也犯了“只看到自己想看”的錯(cuò)誤,認(rèn)為套利成功是大概率事件。這種低級(jí)錯(cuò)誤只能說(shuō)明,作者要么很無(wú)知,要么就是別有用心,鼓動(dòng)賺錢(qián)心切的投資者們參與套利。 在這個(gè)科技迅速發(fā)展、信息爆炸的時(shí)代,交點(diǎn)智商稅有時(shí)候在所難免,就跟以前有人貪便宜買(mǎi)路邊湊上來(lái)的手機(jī)筆記本,結(jié)果發(fā)現(xiàn)是個(gè)模型的道理是一樣的。但是現(xiàn)在的“坑”的技術(shù)也在進(jìn)步,像分級(jí)基金這樣套了幾層外衣的韭菜收割工具,以后肯定還會(huì)層出不窮。這就需要我們好好補(bǔ)習(xí)一些基礎(chǔ)學(xué)科,配得上一個(gè)現(xiàn)代化公民的稱(chēng)號(hào)。? |
|
來(lái)自: quasiceo > 《待分類(lèi)1》