博弈論,有時(shí)也稱為對(duì)策論,或者賽局理論,應(yīng)用數(shù)學(xué)的一個(gè)分支,目前在生物學(xué)、經(jīng)濟(jì)學(xué)、國(guó)際關(guān)系、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。主要研究公式化了的激勵(lì)結(jié)構(gòu)(游戲或者博弈)間的相互作用。是研究具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。 博弈論考慮游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為,并研究它們的優(yōu)化策略。表面上不同的相互作用可能表現(xiàn)出相似的激勵(lì)結(jié)構(gòu)(incentive structure),所以他們是同一個(gè)游戲的特例。其中一個(gè)有名有趣的應(yīng)用例子是囚徒困境(Prisoner's dilemma)。 具有競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為成為博弈行為。在這類行為中,參加斗爭(zhēng)或競(jìng)爭(zhēng)的各方各自具有不同的目標(biāo)或利益。為了達(dá)到各自的目標(biāo)和利益,各方必須考慮對(duì)手的各種可能的行動(dòng)方案,并力圖選取對(duì)自己最為有利或最為合理的方案。比如日常生活中的下棋,打牌等。博弈論就是研究博弈行為中斗爭(zhēng)各方是否存在著最合理的行為方案,以及如何找到這個(gè)合理的行為方案的數(shù)學(xué)理論和方法。 生物學(xué)家使用博弈理論來理解和預(yù)測(cè)進(jìn)化(論)的某些結(jié)果。例如,John Maynard Smith 和George R. Price 在1973年發(fā)表于《自然》雜志上的論文中提出的“evolutionarily stable strategy”的這個(gè)概念就是使用了博弈理論。還可以參見進(jìn)化博弈理論(evolutionary game theory)和行為生態(tài)學(xué)(behavioral ecology)。 博弈論也應(yīng)用于數(shù)學(xué)的其他分支,如概率,統(tǒng)計(jì)和線性規(guī)劃等。 數(shù)學(xué)定義對(duì)于“博弈”(game)有不少可以互換的定義。這里給出簡(jiǎn)短的介紹和相互關(guān)系的說明。 范式博弈(Normal form game)范式博弈又被譯為正則形式的博弈、策略型賽局或標(biāo)準(zhǔn)型賽局。 設(shè)定 N 是一個(gè)“參與者”(players)的集合。對(duì)于每一個(gè)“參與者” 都有一個(gè)給定的“策略”集合. 博弈(游戲)是一個(gè)函數(shù), 定義為: 也就是說,如果我們知道了參與者的策略集合是什么,那么就可以有一個(gè)實(shí)數(shù)值與之對(duì)應(yīng)。 我們可以把上面的方程拆成兩個(gè)方程來進(jìn)一步把它一般化。一個(gè)方程是正則形式(Normal form game)的參與者程,描述策略規(guī)定結(jié)果的方式。 另外一個(gè)方程描寫參與者對(duì)于結(jié)果(outcome)集合的偏好(preference)。也就是: 這里 是游戲(博弈)的結(jié)果集合(outcome set)。對(duì)于每一個(gè)參與者 都有一個(gè)偏好函數(shù)( preference function)
展開形式的博弈(Extensive form game)展開形式的博弈又可譯為擴(kuò)展形式的博弈、擴(kuò)展式賽局或擴(kuò)展型賽局。 正則形式的定義為數(shù)學(xué)家們提供了“均衡”(equilibria)問題的研究一個(gè)容易使用的表達(dá)式。因?yàn)樗苊饬嗽趺从?jì)算“策略”的問題,也就是說游戲是怎么進(jìn)行的問題。 若要考慮游戲是如何進(jìn)行的,展開形式的博弈是一個(gè)比較方便的表達(dá)式。這個(gè)形式與組合博弈論關(guān)系密切。這個(gè)定義通過一個(gè)樹的形式給定。在樹的每一個(gè)節(jié)點(diǎn)(vertex),不同的參與者選擇一個(gè)邊(edge)。 博弈論簡(jiǎn)史對(duì)于博弈論的研究,開始于策墨洛(Zermelo,1913),波雷爾(Borel,1921)及馮·諾伊曼(von Neumann, 1928),后來由馮·諾伊曼和奧斯卡·摩根斯坦(von Neumann and Morgenstern,1944,1947)首次對(duì)其系統(tǒng)化和形式化(參照Myerson, 1991)。隨后約翰·福布斯·納什(John Forbes Nash Jr., 1950, 1951)利用不動(dòng)點(diǎn)定理證明了均衡點(diǎn)的存在,為博弈論的一般化奠定了堅(jiān)實(shí)的基礎(chǔ)。 當(dāng)代博弈論領(lǐng)軍人物
博弈分類博弈的分類根據(jù)不同的基準(zhǔn)也有不同的分類。一般認(rèn)為,博弈主要可以分為合作博弈和非合作博弈。它們的區(qū)別在于相互發(fā)生作用的當(dāng)事人之間有沒有一個(gè)具有約束力的協(xié)議,如果有,就是合作博弈,如果沒有,就是非合作博弈。 從行為的時(shí)間序列性,博弈論進(jìn)一步分為兩類:靜態(tài)博弈是指在博弈中,參與人同時(shí)選擇或雖非同時(shí)選擇但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng);動(dòng)態(tài)博弈是指在博弈中,參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。通俗的理解:"囚徒困境"就是同時(shí)決策的,屬于靜態(tài)博弈;而棋牌類游戲等決策或行動(dòng)有先后次序的,屬于動(dòng)態(tài)博弈 按照參與人對(duì)其他參與人的了解程度分為完全信息博弈和不完全信息博弈。完全博弈是指在博弈過程中,每一位參與人對(duì)其他參與人的特征、策略空間及收益函數(shù)有準(zhǔn)確的信息。如果參與人對(duì)其他參與人的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是對(duì)所有參與人的特征、策略空間及收益函數(shù)都有準(zhǔn)確的準(zhǔn)確信息,在這種情況下進(jìn)行的博弈就是不完全信息博弈。 目前經(jīng)濟(jì)學(xué)家們現(xiàn)在所談的博弈論一般是指非合作博弈,由于合作博弈論比非合作博弈論復(fù)雜,在理論上的成熟度遠(yuǎn)遠(yuǎn)不如非合作博弈論。非合作博弈又分為:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動(dòng)態(tài)博弈。與上述四種博弈相對(duì)應(yīng)的均衡概念為:納什均衡(Nash equilibrium),子博弈精煉納什均衡(subgame perfect Nash equilibrium),貝葉斯納什均衡(Bayesian Nash equilibrium),精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。 博弈論還又很多分類,比如:以博弈進(jìn)行的次數(shù)或者持續(xù)長(zhǎng)短可以分為有限博弈和無限博弈;以表現(xiàn)形式也可以分為一般型(戰(zhàn)略型)或者展開型,等等。 |
|