博弈論

偉天英 2012-02-16

展開全文

博弈論，有時也稱為對策論，或者賽局理論，應用數學的一個分支，目前在生物學、經濟學、國際關系、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。主要研究公式化了的激勵結構（游戲或者博弈）間的相互作用。是研究具有斗爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。

博弈論考慮游戲中的個體的預測行為和實際行為，并研究它們的優化策略。表面上不同的相互作用可能表現出相似的激勵結構(incentive structure)，所以他們是同一個游戲的特例。其中一個有名有趣的應用例子是囚徒困境(Prisoner's dilemma)。

具有競爭或對抗性質的行為成為博弈行為。在這類行為中，參加斗爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益，各方必須考慮對手的各種可能的行動方案，并力圖選取對自己最為有利或最為合理的方案。比如日常生活中的下棋，打牌等。博弈論就是研究博弈行為中斗爭各方是否存在著最合理的行為方案，以及如何找到這個合理的行為方案的數學理論和方法。

生物學家使用博弈理論來理解和預測進化（論）的某些結果。例如，John Maynard Smith 和George R. Price 在1973年發表于《自然》雜志上的論文中提出的“evolutionarily stable strategy”的這個概念就是使用了博弈理論。還可以參見進化博弈理論（evolutionary game theory）和行為生態學（behavioral ecology）。

博弈論也應用于數學的其他分支，如概率，統計和線性規劃等。

數學定義

對于“博弈”(game)有不少可以互換的定義。這里給出簡短的介紹和相互關系的說明。

范式博弈（Normal form game）

范式博弈又被譯為正則形式的博弈、策略型賽局或標準型賽局。

設定 $N$ 是一個“參與者”(players)的集合。對于每一個“參與者” 都有一個給定的“策略”集合. 博弈（游戲）是一個函數，定義為:

也就是說，如果我們知道了參與者的策略集合是什么，那么就可以有一個實數值與之對應。我們可以把上面的方程拆成兩個方程來進一步把它一般化。一個方程是正則形式(Normal form game)的參與者程，描述策略規定結果的方式。另外一個方程描寫參與者對于結果(outcome)集合的偏好(preference)。也就是：

這里是游戲（博弈）的結果集合(outcome set)。對于每一個參與者都有一個偏好函數( preference function)

展開形式的博弈（Extensive form game）

展開形式的博弈又可譯為擴展形式的博弈、擴展式賽局或擴展型賽局。

正則形式的定義為數學家們提供了“均衡”(equilibria)問題的研究一個容易使用的表達式。因為它避免了怎么計算“策略”的問題，也就是說游戲是怎么進行的問題。

若要考慮游戲是如何進行的，展開形式的博弈是一個比較方便的表達式。這個形式與組合博弈論關系密切。這個定義通過一個樹的形式給定。在樹的每一個節點（vertex），不同的參與者選擇一個邊（edge）。

博弈論簡史

對于博弈論的研究，開始于策墨洛(Zermelo,1913)，波雷爾(Borel,1921)及馮·諾伊曼(von Neumann, 1928)，后來由馮·諾伊曼和奧斯卡·摩根斯坦(von Neumann and Morgenstern，1944，1947)首次對其系統化和形式化（參照Myerson, 1991）。隨后約翰·福布斯·納什(John Forbes Nash Jr., 1950, 1951)利用不動點定理證明了均衡點的存在，為博弈論的一般化奠定了堅實的基礎。

當代博弈論領軍人物

約翰·福布斯·納什、約翰·C·海薩尼，以及萊因哈德·澤爾騰。這三人同時因為他們對博弈論的突出貢獻而獲得1994年的瑞典銀行經濟學獎（也稱諾貝爾經濟學獎）。
羅伯特·J·奧曼、肯·賓摩爾、戴維·克瑞普斯，以及阿里爾·魯賓斯坦。

博弈分類

博弈的分類根據不同的基準也有不同的分類。一般認為，博弈主要可以分為合作博弈和非合作博弈。它們的區別在于相互發生作用的當事人之間有沒有一個具有約束力的協議，如果有，就是合作博弈，如果沒有，就是非合作博弈。

從行為的時間序列性，博弈論進一步分為兩類：靜態博弈是指在博弈中，參與人同時選擇或雖非同時選擇但后行動者并不知道先行動者采取了什么具體行動；動態博弈是指在博弈中，參與人的行動有先后順序，且后行動者能夠觀察到先行動者所選擇的行動。通俗的理解："囚徒困境"就是同時決策的，屬于靜態博弈；而棋牌類游戲等決策或行動有先后次序的，屬于動態博弈

按照參與人對其他參與人的了解程度分為完全信息博弈和不完全信息博弈。完全博弈是指在博弈過程中，每一位參與人對其他參與人的特征、策略空間及收益函數有準確的信息。如果參與人對其他參與人的特征、策略空間及收益函數信息了解的不夠準確、或者不是對所有參與人的特征、策略空間及收益函數都有準確的準確信息，在這種情況下進行的博弈就是不完全信息博弈。

目前經濟學家們現在所談的博弈論一般是指非合作博弈，由于合作博弈論比非合作博弈論復雜，在理論上的成熟度遠遠不如非合作博弈論。非合作博弈又分為：完全信息靜態博弈，完全信息動態博弈，不完全信息靜態博弈，不完全信息動態博弈。與上述四種博弈相對應的均衡概念為：納什均衡(Nash equilibrium)，子博弈精煉納什均衡（subgame perfect Nash equilibrium），貝葉斯納什均衡(Bayesian Nash equilibrium)，精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。

博弈論還又很多分類，比如：以博弈進行的次數或者持續長短可以分為有限博弈和無限博弈；以表現形式也可以分為一般型（戰略型）或者展開型，等等。