當前位置:名人名言大全網 - 名人名言 - 舉例說明生活中的囚徒困境。

舉例說明生活中的囚徒困境。

在博弈論中,占優戰略均衡的壹個著名例子是塔克給出的“囚徒困境”博弈模型。這個模型以壹種特殊的方式告訴我們壹個警察和壹個小偷的故事。假設甲、乙兩個小偷共同作案,私自入室,被警察抓住。警察把這兩個人放在兩個不同的房間裏審訊。對於每壹個嫌疑人,警方給出的政策是,如果壹個嫌疑人交代了自己的罪行,交出了贓物,證據確鑿,兩人都定罪。如果另壹名嫌疑人也供認不諱,他們各被判處8年徒刑;如果另壹個犯罪嫌疑人在沒有坦白的情況下否認,會以妨礙公務罪(因為有證據證明他有罪)再判兩年有期徒刑,坦白者減刑八年後立即釋放。如果兩人都否認,警方因證據不足不能判他們盜竊罪,但可以以非法侵入罪各判1年有期徒刑。表2.2顯示了這個博弈的收益矩陣。

表2.2囚徒困境博弈【囚徒困境】

——————————————————————————

┃·┃·┃

————————┃————————┃————————┃

坦白,否認

————————┃————————┃————————┃

告白┃–8,–8┃0,–10┃

————————┃————————┃————————┃

壹個否定┃–10,0 ┃–1,–1┃

————————┃————————┃————————┃

讓我們看看這個博弈的可預測均衡是什麽。對於A來說,他雖然不知道B選擇什麽,但是他知道不管B選擇什麽,選擇“表白”永遠是對他最好的。很明顯,根據對稱性,B也會選擇“表白”。結果兩人都被判有期徒刑8年。但如果都選擇“否認”,每人只判1年。在表2.2的四個行動選擇組合中,(拒絕,否認)是帕累托最優的,因為任何偏離這個行動選擇組合的其他行動選擇組合至少會使壹個人的處境更糟。不難看出,“坦白”是任何犯罪嫌疑人的優勢策略,而(坦白,認罪)是壹個優勢戰略均衡。

要理解納什的貢獻,首先要知道什麽是非合作博弈問題。目前幾乎所有的博弈論教材都會講到“囚徒困境”的例子,每本書裏的例子都差不多。

博弈論畢竟是數學,或者說,是運籌學的壹個分支。談論經典和學說,自然少不了數學語言,在外行人看來不過是壹大堆數學公式。好在博弈論關註的是日常經濟生活,不能不吃煙花。這個理論其實是從象棋、撲克、戰爭等帶有競爭、對抗、決策性質的問題中借用來的術語。聽起來有點玄乎,但實際上有著重要的現實意義。博弈論大師看經濟社會問題就像下棋壹樣,往往在博弈中有深刻的道理。所以,從日常生活中的瑣事入手,以身邊的故事為例進行講解,並不枯燥。壹天,壹個富人在家裏被殺,他的財產被盜。在這起案件的調查過程中,警方抓獲了兩名犯罪嫌疑人斯卡菲和納庫爾斯,並從他們的住處找到了被害人家中的失物。但他們否認自己殺了人,辯稱是先殺了有錢人,然後他們只是偷了東西。於是民警將兩人隔離,分別放在不同的房間審訊。地方檢察官會和每個人單獨談話。公訴人說,“因為妳有盜竊的確鑿證據,可以判妳壹年有期徒刑。”但是我可以和妳做個交易。如果妳單獨承認謀殺,我只會判妳三個月監禁,但妳的同夥會判十年監禁。如果妳拒絕坦白,被伴侶舉報,妳會被判十年有期徒刑,他只會被判三個月有期徒刑。但是,如果妳們都坦白,那麽妳們都將被判處五年監禁。“Scalfi和Nacoors應該怎麽做?他們面臨著壹個兩難的境地——坦白還是否認。很明顯,最好的策略是雙方都否認,結果大家都只判壹年。但由於兩人處於隔離狀態,無法表白。所以,根據亞當·斯密的理論,每個人都是從利己的目的出發,他們選擇懺悔是最好的策略。因為如果妳坦白,妳可以期待三個月的短期監禁,但前提是妳的伴侶否認,這顯然比妳自己否認的10年監禁要好。這種策略是損人利己的。不僅如此,表白還有更多好處。如果對方坦白否認,就要坐牢10年。太不劃算了!所以,在這種情況下,還是應該選擇坦白。就算兩個人同時坦白,最多也只判五年,總比判10年強。所以兩者合理的選擇是坦白,原本對雙方都有利的策略(否認)和結局(判1年有期徒刑)都不會出現。這樣兩個人都選擇了弗蘭克策略而被判五年的結果叫做“納什均衡”,也叫非合作均衡。因為,每壹方在選擇策略時,並不存在“共謀”(勾結),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。換句話說,這個策略組合是由所有參與者(也稱為當事人和參與者)的最佳策略組合組成的。沒有人會為了給自己爭取更大的利益而主動改變策略。”囚徒困境”具有廣泛而深刻的意義。個人理性和集體理性的沖突,每個人對自身利益的追求,導致壹個“納什均衡”,這也是壹個對所有人都不利的結局。兩人都是在坦白否認的策略中先想到自己,所以必然要服長刑期。只有都先想到對方,或者互相勾結(勾結),才能得到最短監禁的結果。納什均衡首先挑戰亞當·斯密的“看不見的手”原理。根據斯密的理論,在市場經濟中,每個人都是從利己的目的出發,最終整個社會達到利他的效果。讓我們回顧壹下這位經濟聖人在《國富論》中的名言:“通過追求(個人)私利,他常常比他實際想做的更有效地促進社會利益。“從‘納什均衡’引出壹個‘看不見的手’原理的悖論:從利己出發,結果不是利己,既不是利己,也不是利己。這是兩個囚犯的命運。從這個意義上說,納什均衡提出的悖論實際上動搖了西方經濟學的基石。所以,從納什均衡中,我們也可以悟出壹個道理:合作是有利的“利己策略”。但它必須符合以下黃金律:妳希望別人如何對待妳,妳就如何對待別人,但前提是別人也這樣做。那就是中國人說的,“己所不欲,勿施於人”。但前提是妳不要對我做妳不想讓我做的事。其次,“納什均衡”是非合作博弈均衡。現實中,非合作情況比合作情況更普遍。因此,“納什均衡”是馮·諾依曼和摩根·斯特恩合作博弈論的重大發展,甚至可以說是壹場革命。

從納什均衡的普遍意義上,我們可以深刻理解經濟、社會、政治、國防、管理和日常生活中常見的博弈現象。我們會舉很多類似於“囚徒困境”的例子。比如價格戰,軍事競爭,汙染等等。壹般的博弈問題由三個要素組成:玩家,也稱當事人、參與者、策略等的集合。每個玩家的策略和收益。其中,所謂贏,是指如果選擇特定的戰略關系,每個博弈中的人得到的效用。所有的遊戲問題都會遇到這三個要素。

價格戰遊戲:

現在我們經常會遇到各種各樣的家電價格戰,比如彩電戰、冰箱戰、空調戰、微波爐戰...這些戰爭的受益者首先是消費者。每次看到家電價格戰,老百姓都會“沒什麽好偷的。”這裏可以說明,廠商價格戰的結局也是壹個“納什均衡”,價格戰的結果是誰都沒錢賺。因為博弈雙方的利潤正好為零。競爭的結果是穩定的,也就是壹個“納什均衡”。這個結果可能對消費者有利,但對廠商來說是災難性的。所以,價格戰對廠商來說意味著自殺。從這個案例中,我們可以引出兩個問題。首先,競爭性降價或“納什均衡”的結果可能導致有效率的零利潤結果。第二,如果不采取價格戰,作為敵對博弈會有什麽結果?每個企業都會考慮采取正常價格策略或高價策略,形成壟斷價格,盡力獲取壟斷利潤。如果能形成壟斷,博弈雙方的利潤最大。這種情況就是壟斷所為,通常會擡高價格。另壹個極端,如果廠商使用正常價格,雙方都能獲利。從這壹點出發,我們得出另壹條基本規則:“在假設妳的對手會以其最大利益行事的基礎上構建妳自己的戰略。”事實上,完全競爭的均衡就是納什均衡或非合作博弈均衡。在這種狀態下,每個制造商或消費者都根據其他人設定的所有價格做出決策。在這個均衡中,每個企業都應該使其利潤最大化,消費者也應該使其效用最大化,導致零利潤,即價格等於邊際成本。在完全競爭的情況下,非合作行為導致社會所期望的經濟效率狀態。如果制造商采取合作行動,並決定轉向壟斷價格,社會的經濟效率將被摧毀。這就是為什麽WTO和各國政府加強反壟斷具有重要意義。