定義 假設有n個局中人參與博弈,給定其他人策略的條件下,每個局中人選擇自己的
納什均衡
最優策略(個人最優策略可能依賴於也可能不依賴於他人的戰略),從而使自己利益最大化。所有局中人策略構成壹個策略組合(Strategy Profile)。納什均衡指的是這樣壹種戰略組合,這種策略組合由所有參與人最優策略組成。即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。納什均衡,從實質上說,是壹種非合作博弈狀態。
納什均衡達成時,並不意味著博弈雙方都處於不動的狀態,在順序博弈中這個均衡是在博弈者連續的動作與反應中達成的。納什均衡也不意味著博弈雙方達到了壹個整體的最優狀態,以下的囚徒困境就是壹個例子。
編輯本段數學定義 納什均衡的定義:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各個博弈方的各壹個策略組成的某個策論組合(s1*,…,sn*)中,任壹博弈方i的策論si*,都是對其余博弈方策略的組合(s1*,…s*i-1,s*i+1,…,sn*)的最佳對策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)對任意sij∈Si都成立,則稱(s1*,…,sn*)為G的壹個納什均衡。
編輯本段命名原因 約翰·福布斯·納什(John Forbes Nash Jr)1948年作為年輕數學博士生進入普林斯頓大學。其研究成果見於題為《非合作博弈》(1950)的博士論文。該博士論文導致了《n人博弈中的均衡點》(1950)和題為《非合作博弈》(1951)兩篇論文的發表。納什在上述論文中,介紹了合作博弈與非合作博弈的區別。他對非合作博弈的最重要貢獻是闡明了包含任意人數局中人和任意偏好的壹種通用解概念,也就是不限於兩人零和博弈。該解概念後來被稱為納什均衡。
納什的主要學術貢獻體現在1950年和1951年的兩篇論文,1950年他才把自己的研究成果寫成題為“非合作博弈”的文章刊登在美國全國科學院每月公報上,立即引起轟動。說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低,嘲笑幾天之後,他遇到蓋爾,像說夢話似的告訴他自己已經將馮·諾依曼的“最小最大原理找到了普遍化的方法和均衡點。納什這個初出茅廬的小子,根本不知道競爭的險惡,從沒想到學術欺騙的後果。結果還是戴維·蓋爾充當了他的“經紀人”,起草致科學院的短信,系主任列夫謝茨則利用方便的人脈關系親自將文稿遞交給科學院。納什寫的文章不多,他辯解說:少了才是精品。中國國內提壹個教授,要求在“核心的刊物”上發表多少篇文章。按照這個標準可能納什還不壹定夠資格。 1996年諾貝爾經濟學獎得主莫爾裏斯當牛津大學艾奇沃思經濟學講座教授時也沒有發表過什麽文章,特殊的人才,必須有特殊的選拔辦法。
Nash平衡是指博弈中這樣的局面,對於每個參與者來說,只要其他人不改變策略,他就無法改善自己的狀況。Nash在證明了在每個參與者都只有有限種策略選擇、並允許混合策略的前提下,Nash平衡壹定存在。以兩家公司的價格大戰為例,Nash平衡意味著兩敗俱傷的可能:在對方不改變價格的條件下,既不能提價,否則會進壹步喪失市場;也不能降價,因為會出現賠本甩賣。於是兩家公司可以改變原先的利益格局,通過談判尋求新的利益評估分攤方案,也就是Nash平衡。類似的推理當然也可以用到選舉,群體之間的利益沖突,潛在戰爭爆發前的僵局,議會中的法案爭執等。
編輯本段分類 納什均衡可以分成兩類:“純戰略納什均衡”和“混合戰略納什均衡”。
要說明純戰略納什均衡和混合戰略納什均衡,要先說明純戰略和混合戰略。
所謂純戰略是提供給玩家要如何進行賽局的壹個完整的定義。特別地是,純戰略決定在任何壹種情況下要做的移動。戰略集合是由玩家能夠施行的純戰略所組成的集合。而混合戰略是對每個純戰略分配壹個機率而形成的戰略。混合戰略允許玩家隨機選擇壹個純戰略。混合戰略博弈均衡中要用概率計算,因為每壹種策略都是隨機的,達到某壹概率時,可以實現支付最優。因為機率是連續的,所以即使戰略集合是有限的,也會有無限多個混合戰略。
當然,嚴格來說,每個純戰略都是壹個“退化”的混合戰略,某壹特定純戰略的機率為 1,其他的則為 0。
故“純戰略納什均衡”,即參與之中的所有玩家都玩純戰略;而相應的“混合戰略納什均衡”,之中至少有壹位玩家玩混合戰略。並不是每個賽局都會有純戰略納什均衡,例如“錢幣問題"就只有混合戰略納什均衡,而沒有純戰略納什均衡。不過,還是有許多賽局有純戰略納什均衡(如協調賽局,囚徒困境和獵鹿賽局)。甚至,有些賽局能同時有純戰略和混合戰略均衡。
編輯本段經典案例囚徒困境 (1950年,數學家塔克任斯坦福大學客座教授,在給壹些心理學家作講演時,講到兩個囚犯的故事。)
假設有兩個小偷A和B聯合犯事、私入民宅被警察抓住。警方將兩人分別置於不同的兩個房間內進行審訊,對每壹個犯罪嫌疑人,警方給出的政策是:如果壹個犯罪嫌疑人坦白了罪行,交出了贓物,於是證
納什均衡
據確鑿,兩人都被判有罪。如果另壹個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另壹個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。囚徒困境博弈
A╲B 坦白 抵賴
坦白 -8,-8 0,-10
抵賴 -10,0 -1,-1
關於案例,顯然最好的策略是雙方都抵賴,結果是大家都只被判1年。但是由於兩人處於隔離的情況,首先應該是從心理學的角度來看,當事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當·斯密的理論,假設每個人都是“理性的經濟人”,都會從利己的目的出發進行選擇。這兩個人都會有這樣壹個盤算過程:假如他坦白,如果我抵賴,得坐10年監獄,如果我坦白最多才8年;假如他要是抵賴,如果我也抵賴,我就會被判壹年,如果我坦白就可以被釋放,而他會坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對我而言都是坦白了劃算。兩個人都會動這樣的腦筋,最終,兩個人都選擇了坦白,結果都被判8年刑期。
基於經濟學中Rational agent的前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被釋放就不會出現。這樣兩人都選擇坦白的策略以及因此被判8年的結局,納什均衡”首先對亞當·斯密的“看不見的手”的原理提出挑戰:按照斯密的理論,在市場經濟中,每壹個人都從利己的目的出發,而最終全社會達到利他的效果。但是我們可以從“納什均衡”中引出“看不見的手”原理的壹個悖論:從利己目的出發,結果損人不利己,既不利己也不利他。硬幣正反 妳正在圖書館枯坐,壹位陌生美女主動過來和妳搭訕,並要求和妳壹起玩個數學遊戲。美女提議:“讓我們各自亮出硬幣的壹面,或正或反。如果我們都是正面,那麽我給妳3元,如果我們都是反面,我給妳1元,剩下的情況妳給我2元就可以了。”那麽該不該和這位姑娘玩這個遊戲呢?這基本是廢話,當然該。問題是,這個遊戲公平嗎?
每壹種遊戲依具其規則的不同會存在兩種納什均衡,壹種是純策略納什均衡,也就是說玩家都能夠采取固定的策略(比如壹直出正面或者壹直出反面),使得每人都賺得最多或虧得最少;或者是混合策略納什均衡,而在這個遊戲中,便應該采用混合策略納什均衡。
n\m 美女出正面 美女出反面
妳出正面 +3,-3 -2,+2
妳出反面 -2,+2 +1,-1
假設我們出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。為了使利益最大化,應該在對手出正面或反面的時候我們的收益都相等,由此列出方程就是
3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )
解方程得x=3/8。
同樣,美女的收益,列方程
-3y + 2( 1-y)= 2y+ (-1) * ( 1-y)
解得y也等於3/8,而美女每次的期望收益則是 2(1-y)- 3y = 1/8元。這告訴我們,在雙方都采取最優策略的情況下,平均每次美女贏1/8元。
其實只要美女采取了(3/8,5/8)這個方案,不論妳再采用什麽方案,都是不能改變局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任 何策略無非只是上面兩種策略的線性組合,所以期望還是-1/8元。但是當妳也采用最佳策略時,至少可以保證自己輸得最少。否則,妳肯定就會被美女采用的策略針對,從而賠掉更多。
編輯本段重要影響 納什均衡理論奠定了現代主流博弈理論和經濟理論的根本基礎,正如克瑞普斯(Kreps,1990)在《博弈論和經濟建模》壹書的引言中所說,“在過去的壹二十年內,經濟學在方法論以及語言、概念等方面,經歷了壹場溫和的革命,非合作博弈理論已經成為範式的中心……在經濟學或者與經濟學原理相關的金融、會計、營銷和政治科學等學科中,現在人們已經很難找到不懂納什均衡能夠‘消費’近期文獻的領域。”納什均衡的重要影響可以概括為以下六個方面
1.改變了經濟學的體系和結構。非合作博弈論的概念、內容、模型和分析工具等,均已滲透到微觀經濟學、宏觀經濟學、勞動經濟學、國際經濟學、環境經濟學等經濟學科的絕大部分學科領域,改變了這些學科領域的內容和結構,成為這些學科領域的基本研究範式和理論分析工具,從而改變了原有經濟學理論體系中各分支學科的內涵。
2.擴展了經濟學研究經濟問題的範圍。原有經濟學缺乏將不確定性因素、變動環境因素以及經濟個體之間的交互作用模式化的有效辦法,因而不能進行微觀層次經濟問題的解剖分析。納什均衡及相關模型分析方法,包括擴展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經濟學家們提供了深入的分析工具。
3.加強了經濟學研究的深度。納什均衡理論不回避經濟個體之間直接的交互作用,不滿足於對經濟個體之間復雜經濟關系的簡單化處理,分析問題時不只停留在宏觀層面上而是深入分析表象背後深層次的原因和規律,強調從微觀個體行為規律的角度發現問題的根源,因而可以更深刻準確地理解和解釋經濟問題。
4.形成了基於經典博弈的研究範式體系。即可以將各種問題或經濟關系,按照經典博弈的類型或特征進行分類,並根據相應的經典博弈的分析方法和模型進行研究,將壹個領域所取得的經驗方便地移植到另壹個領域。
5.擴大和加強了經濟學與其他社會科學、自然科學的聯系。納什均衡之所以偉大,就因為它普通,而且普通到幾乎無處不在。納什均衡理論既適用於人類的行為規律,也適合於人類以外的其他生物的生存、運動和發展的規律。納什均衡和博弈論的橋梁作用,使經濟學與其他社會科學、自然科學的聯系更加緊密,形成了經濟學與其他學科相互促進的良性循環。
6.改變了經濟學的語言和表達方法。在進化博弈論方面相當有造詣的坎多利(Kandori,1997)對保羅·薩繆爾森(Paul Samuelson)的名言“妳甚至可以使壹只鸚鵡變成壹個訓練有素的經濟學家,因為它必須學習的只有兩個詞,那就是‘供給’和‘需求’”,曾做過壹個幽默的引申,他說,“現在這只鸚鵡需要再學兩個詞,那就是‘納什均衡’”。