博弈論入門筆記的最后一篇,終于要談到一點更接近現實的東西。
首先再回顧納什均衡的含義:任何人的策略相對于其他人都是最好的,也就是說,在達到納什均衡時,一個參與者任何的策略改變都會導致一個對自身比現在更差的結果。
對納什均衡很有意思的一個觀察結論是,這是一種博弈結果,它只是說,在納什均衡的情況下,你做出的改變都是對個人不利的,但,這并不意味著納什均衡是最好的選擇。比如qwerty鍵盤。有沒有比這種鍵盤更好的輸入方式?答案肯定是有,但是如果任何其他人都還在使用這種鍵盤,那么你個人改變使用鍵盤的習慣,就可能導致一種不兼容。這樣,最終的結果是你自己無法被拋棄。
這里說到的問題其實是納什均衡的無效率問題。這是什么意思呢,就是說,納什均衡時從博弈出發的,他追求的是個人相對他人利益的最大化,但是,個人相對他人利益最大化的總和未必就能促進社會本身的發展。
再換一種說法,納什均衡表現的是個體理性,但個體理性未必是一個社會整體的最好選擇。個體理性不同于群體理性。
以囚徒困境的例子為例。如果兩名囚犯合作,那么他們的支付結果是(2,2),但是,由于任何一個人背叛合作就可能使自己的支付變成0,使得對手變為-10,那么從個體理性出發,任何人不敢采取合作策略,因為如果自己采取合作策略,對方就可能使你的支付變成-10。這不是最好的選擇,于是乎,囚犯都會選擇不合作。這樣,納什均衡達成,每個人的支付是(1,1)。
從這個例子上就看出,如果從群體理性出發,雙方合作是最好的選擇;但從個體理性出發,雙方都不合作才是最好的選擇。這就說明,個體理性不同于群體理性。個體理性的總和可能小于群體理性。
在環保問題上,這個問題非常明顯。例如,雖然大家都知道每個人環保,那么這個世界就會變得更好。但是,在沒有任何約束之下,一個人做出環保的舉動是有代價的。比如,你每天改為做公交,減少污染排放,這樣總的污染是下降的,但是,在沒有任何約束的情況下,別人可能繼續開車,這樣他既沒有讓自己增加交通成本,而且有均攤了污染下降的好處。
這樣的結果是什么?那就是你也不是傻子,你也不想我做了好事,但是卻被別人占有了,所以你也不要環保了,繼續污染。而且更為嚴重的是,在沒有任何約束的情況下,你還有可能變本加厲污染,因為只要你比別人污染的更多,你總體上獲得的效用就可能更多。別人也不傻,如此循環,于是污染終于越來越嚴重。
個體理性不同于群體理性,這一點并不是得到普遍認可的。比如經濟學的鼻祖亞當斯密就說,每個人的自利最終會增進社會的總體福利。在一個充分競爭的市場上,這是成立的。但是,直到博弈論出現,這一觀點才受到了更多的質疑。
從諾貝爾經濟學獎得主的名單上可以看出博弈論后來的勝出。在上世紀70-80年代,諾獎得主是哈耶克,貝克爾,弗里德曼等自由派經濟學者,但在后來,納什,馬斯金,羅斯,以及最新的梯若爾都是博弈論的大家。當然在此之前,肯尼斯阿羅等人也是博弈論的運用者。
既然個體理性不等于群體理性甚至會導致社會整體福利下降,那么怎么做呢?從剛才環保的例子看,一個導致污染的原因其實可能是約束的缺乏或者策略的缺失。于是,從社會整體福利的角度看,要達到社會理性的最大,就必須有強制手段。這些手段總結為一下幾點:
1 改變博弈的策略 博弈論是從博弈規則出發,導出結果。反過來,我們可以反過來,看好的結果是什么,然后改變規則。一個例子是醫院與青年醫生的配對,研究者是諾獎得主羅斯。 2 建立契約 違背契約的遭受懲罰。使得違約受益小于懲罰。這點比較簡單。 但是訴訟成本過高有時候也會妨礙契約效力。有時候也無法建立契約,比如全球變暖。 3 長期關系 很多時候是無法建立契約的。這時候可能通過建立長期聯系來提供總收益。 這一策略的原理是,你可以獲得一次性收益,但代價是付出所有未來收益,而未來收益遠高于一次性收益,于是因為懼怕損失,你必須保持長期關系。 舉個例子,旅游區的一家飯館,因為人人可能只來一次,所以非常有漫天要價惡劣服務的問題。但是,由于社交媒體的使用,一旦你有問題,用餐者會馬上通過社交媒體讓你名譽掃地,如此你的生意就沒法做了。
說到這,博弈論入門筆記基本到此結束了。最后是一個對博弈論的總結筆記:
1 博弈論提供一個總的原則,適應于所有社會問題的解決 2 納什均衡的出現原因眾多,無論參與者是理性,不理性,還是無智商,都有可能達成納什均衡。 3在不同的應用中,博弈論的預測力量并不一樣。相對越復雜的情況,比如選舉,博弈論的預測能力就越差。 4 博弈論的預測能力雖然不完美,但是是有用的。以選舉為例,博弈論可以給我們以有益的洞察,提供思考的出發點(投票中位數理論)。人們不可能總是達成納什均衡,但是穩定的行為模式即納什均衡還是經常觀察得到。 5 最重要的是,個體理性和群體理性不一致。因此為了社會的總體福利,需要解決個體理性和群體理性的不一致問題。
|