當前位置:名人名言大全網 - 名言警句 - 智豬博弈論與納什均衡

智豬博弈論與納什均衡

智豬博弈理論

介紹

在博弈論(Game Theory)經濟學中,“智豬博弈”是壹個著名的納什均衡的例子。假設豬圈裏有壹頭大豬、壹頭小豬。豬圈的壹頭有豬食槽,另壹頭安裝著控制豬食供應的按鈕,按壹下按鈕會有10個單位的豬食進槽,但是誰按按鈕就會首先付出2個單位的成本,若大豬先到槽邊,大小豬吃到食物的收益比是9∶1;同時到槽邊,收益比是7∶3;小豬先到槽邊,收益比是6∶4。那麽,在兩頭豬都有智慧的前提下,最終結果是小豬選擇等待。

實際上小豬選擇等待,讓大豬去按控制按鈕,而自己選擇“坐船”(或稱為搭便車)的原因很簡單:在大豬選擇行動的前提下,小豬也行動的話,小豬可得到1個單位的純收益(吃到3個單位食品的同時也耗費2個單位的成本,以下純收益計算相同),而小豬等待的話,則可以獲得4個單位的純收益,等待優於行動;在大豬選擇等待的前提下,小豬如果行動的話,小豬的收入將不抵成本,純收益為-1單位,如果小豬也選擇等待的話,那麽小豬的收益為零,成本也為零,總之,等待還是要優於行動。 用博弈論中的報酬矩陣可以更清晰的刻畫出小豬的選擇:

從矩陣中可以看出,當大豬選擇行動的時候,小豬如果行動,其收益是1,而小豬等待的話,收益是4,所以小豬選擇等待;當大豬選擇等待的時候,小豬如果行動的話,其收益是-1,而小豬等待的話,收益是0,所以小豬也選擇等待。綜合來看,無論大豬是選擇行動還是等待,小豬的選擇都將是等待,即等待是小豬的占優策略。

在小企業經營中,學會如何“搭便車”是壹個精明的職業經理人最為基本的素質。在某些時候,如果能夠註意等待,讓其他大的企業首先開發市場,是壹種明智的選擇。這時候有所不為才能有所為!

高明的管理者善於利用各種有利的條件來為自己服務。“搭便車”實際上是提供給職業經理人面對每壹項花費的另壹種選擇,對它的留意和研究可以給企業節省很多不必要的費用,從而使企業的管理和發展走上壹個新的臺階。這種現象在經濟生活中十分常見,卻很少為小企業的經理人所熟識。

博弈與制度 由智豬博弈故事得到的啟示

在這個例子中,對小豬而言,無論大豬是否踩動踏板,不去踩踏板總比踩踏板好。反觀大豬,明知小豬不會去踩踏板,但是去踩踏板總比不踩強,所以只好親歷親為了。這個案例令我們不得不思考——

博弈與制度

“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發。在博弈中,每壹方都要想方設法攻擊對方、保護自己,最終取得勝利;但同時,對方也是壹個與妳壹樣理性的人,他會這麽做嗎?這時就需要更高明的智慧。博弈其實是壹種鬥智的競爭。作為壹門科學,博弈論就是研究不同主體之間相互影響行為的壹種學問。或者準確地說,博弈論是研究決策主體行為發生直接相互作用時的決策以及這種決策的均衡問題的學問,因此也有人把它稱為“對策論”。

對於企業經營者來說,如何理解博弈論,如何運用博弈論原理指導企業有效管理,這是值得思考的事情。在價格和產量決策、經濟合作和經貿談判、引進和開發新技術或新產品、參與投標拍賣、處理勞資關系,以及在與政府的關系和合作等多方面,博弈論都是企業經營者十分有效的決策工具,或者至少是比較科學的決策思路。

還有壹個經典案例,是說當年英國政府將流放澳洲的犯人交給往來於澳洲之間的商船來完成,由此經常會發生因商船主或水手虐待犯人,致使大批流放人員因此死在途中(葬身大海)的事件發生。後來大英帝國對運送犯人的辦法(制度)稍加改變,流放人員仍然由往來於澳洲的商船來運送,只是運送犯人的費用要等到犯人送到澳洲後才由政府支付給商船。僅就這樣壹點小小的“改變”,幾乎再也沒有犯人於中途死掉的事情發生。

關於這壹問題,現任招商局掌門人秦曉先生在最近做客央視《對話》節目時,也談了他的壹些看法。他認為:企業領導人應該去制定遊戲規則,而不應該單純地去做裁判。他覺得制度應當比個人的權威和魅力更重要。小平同誌講過壹句話,說壹個好的制度可以約束壞人;壹個壞的制度呢可以使好人變壞。回顧歷史,我們動不動就說獲諾貝爾獎學金會怎麽樣,愛迪生又發明了什麽,但幾乎少有人講保險制度對社會進步的貢獻有多大,專利制度對社會進步的貢獻有多大。於是乎,又引出另壹個新的問題——

制度與文化

在企業文化研究中,人們對“文化與制度”的認識經常陷入壹種誤區:或把二者對立起來,或把二者混為壹談,分不清二者在企業管理中的地位與作用。有人把企業文化概括成三個層次:物質文化、制度文化和精神文化。這種從廣義角度界定的企業文化,無疑把制度包含在內,即制度也是壹種文化。但如果我們從狹義角度去研究企

業文化,制度只是文化的壹種載體。制度與文化屬於兩個不同層次的管理和兩種不同的管理方式。文化管理高於制度管理。制度更多地強調外在的監督與控制,是企業倡導的“文化底限”,即要求員工必須做到的;文化則更多地強調價值觀、理想信念和道德力量,強調內在的自覺與自律,是“文化高境界”。

制度與文化是互動的。當管理者認為某種文化需要倡導時,他可能通過培養典型的形式,也可能通過開展活動的形式來推動和傳播。但要把倡導的新文化滲透到管理過程之中,變成人們的自覺行動,制度則是最好的載體之壹。文化優劣或主流文化的認同度決定著制度的成本。當企業倡導的優秀文化且主流文化認同度高時,企業制度成本就低;當企業倡導的文化適應性差且主流文化認同度低時,企業的制度成本則高。由於制度是外在約束,當制度文化尚未形成時,在沒有監督的情況下,員工就可能“越軌”或不能按要求去做,其成本自然就高;當制度文化形成以後,人們自覺從事工作,制度成本就會大大降低,尤其當超越制度的文化形成時,制度成本就會更低。企業制度文化是企業文化的重要組成部分,制度文化又是精神文化的基礎和載體,並對企業精神文化起反作用。壹定的企業機制的建立,又影響人們選擇新的價值觀念,成為新的精神文化的基礎。企業文化總是沿著精神文化——制度文化——新的精神文化的軌跡不斷發展、豐富和提高。企業的制度文化也是企業行為文化得以貫徹的保證。同企業職工生產、學習、娛樂、生活等方面直接發生聯系的行為文化建設如何,企業經營作風是否具有活力、是否嚴謹,精神風貌是否高昂,人際關系是否和諧,職工文明程度是否得到提高等,無不與制度文化的保障作用有關。由此可見,優秀企業文化的管理制度,必須是科學、完善、實用的管理方式的體現。

既然這樣,有人就認為,壹個企業的管理是否完善,應憑它有多少條制度來衡量, 規章制度 越多,說明企業管理越完善,企業越有發展潛力。甚至還有人認為企業管理

中最好不要存在管理藝術,只要企業管理制度完善了,企業就會杜絕壹切可能出現的錯誤,這就是企業管理追求的境界。制度真能解決壹切嗎?我們先看看兩個例子。美國資本市場作為世界上運作最規範及效率最高的市場之壹,其運行模式壹直被作為其它市場的學習對象。可是近年來卻頻頻暴露出壹系列醜聞,先有安然事件,再有世界通訊、華爾街中介的作假行為,這不由讓我們產生反思,美國有世界上最好的公司制度,有強有力的監督機制,有完善的法治體制,為何制度會失效呢?這時,我們不得不研究——

法治與文化

企業作為市場經濟中創造價值的主要實體,它的活動需要博弈,更需要規則。依法治企是市場經濟發展的必然選擇。歷史上最早的市場經濟的確是完全的自由經濟,政府只充當市場的“守夜人”。然而,西方發達國家在歷經“自由競爭”的磨難之後,深感缺乏法治的經濟雖然“自由”,但所付出的代價太大,於是不約而同地選擇了經濟法治,以求借助法治的力量來引導、規範和制約亞當斯密那只“看不見的手”。 作為壹種制度方式,法律的存在價值在於介入社會並且調控內在的關系。然而,就因為這樣壹門以解決問題為導向的學科,法學吸收了大量的研究方法去觀察世界,並以豐富多彩的表現形式反哺於其他學科。現在從學科的研究成果來看,不管是法學還是經濟學,它們的核心主題是制度。因為,社會科學的問題無外乎描述社會如何存在和運行的實證理論應該如何規範的理論,二者的結合則有種種所謂“改造世界”的政策主張和制度建構。這樣,市場博弈就成了法律和經濟的最佳結合點。壹項法律規則會引申出壹套博弈規則,簽訂壹個契約也就意味著已經進入壹種博弈。

但任何人都知道,沒有壹項法制是包治百病的,只有對法制的內涵有正確的理解,才不會陷入制度的陷阱之中。同樣,企業管理規章制度作為正式制度之壹,是用“他

律”來規範員工的行為,它的作用是顯而易見的,是壹種顯性的制度。但是企業僅僅有規章管理制度還是不夠的,在正式制度之外有管理漏洞的空白,這就需要另壹種制度來配合,那就是企業文化。新制度經濟學認為,制度包括了正式制度和非正式制度。正式制度是指人們有意識創造的壹系列政策法規,包括了政治、經濟制度及由這些規則構成的等級結構。具體到企業則指企業的產權制度、治理結構、組織結構及規章制度。非正式制度是指人們在長期交往中形成的、世代相傳的壹部分文化。對企業而言,它主要指企業文化。如果說企業管理制度是讓想犯罪的人沒有機會犯罪,那麽企業文化就是讓有機會犯罪的人不願意犯罪!我們強調依法治企,是沒有任何錯誤的,因為我們的企業還有很多人治的色彩,還沒有與真正意義上的市場經濟接軌。但強調的是,如果對其依賴過了頭,就等於說有了法律和制度就會有壹切,從這個意義上講恐怕就有失偏頗。無疑,企業文化是“以人為本”思想在企業管理中成功應用的最新成果。這裏強調企業管理要做到正式制度和非正式制度的有機結合,換而言之,就是在抓法治中推進企業文化建設;同時,通過企業文化建設,進壹步實現企業法治。

綜上所述,企業文化從某種意義上說是企業家的文化。但企業黨的組織和工作機關作為企業文化建設的實施者,不能僅停留在理論層面談文化建設,如果能夠把制度建設和依法治企作為工作的切入點,不斷加大對企業文化的建設力度,這樣不但能使企業文化建設產生“吹糠見米”的作用,而且也使企業文化建設有了堅實可靠的保證。

納什均衡

百科名片

納什均衡,Nash equilipium ,又稱為非合作博弈均衡,是博弈論的壹個重要術語,以約翰·納什命名。

目錄[隱藏] 納什均衡名稱來源及簡介: 納什均衡定義: 納什均衡經典案例:囚徒困境 納什均衡的重要影響

納什的傳記:《普林斯頓的幽靈》

納什均衡名稱來源及簡介:

約翰·納什1948年作為年輕數學博士生進入普林斯頓大學。其研究成果見於題為《非合作博弈》(1950)的博士論文。該博士論文導致了《n人博弈中的均衡點》(19

50)和題為《非合作博弈》(1951)兩篇論文的發表。納什在上述論文中,介紹了合作博弈與非合作博弈的區別。他對非合作博弈的最重要貢獻是闡明了包含任意人數局中人和任意偏好的壹種通用解概念,也就是不限於兩人零和博弈。該解概念後來被稱為納什均衡。

納什均衡定義:

假設有n個局中人參與博弈,給定其他人策略的條件下,每個局中人選擇自己的 最優策略(個人最優策略可能依賴於也可能不依賴於他人的戰略),從而使自己利益最大化。所有局中人策略構成壹個策略組合(Strategy Profile)。納什均衡指的是這樣

壹種戰略組合,這種策略組合由所有參與人最優策略組成。即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。納什均衡,從實質上說,是壹種非合作博弈狀態。

納什均衡經典案例:囚徒困境

(1950年,數學家塔克任斯坦福大學客座教授,在給壹些心理學家作講演時,講到兩個囚犯的故事。)

假設有兩個小偷A和B聯合犯事、私入民宅被警察抓住。警方將兩人分別置於不同的兩個房間內進行審訊,對每壹個犯罪嫌疑人,警方給出的政策是:如果壹個犯罪嫌疑人坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪。如果另壹個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另壹個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。表2.2給出了這個博弈的支付矩陣。

表2.2 囚徒困境博弈

關於案例,顯然最好的策略是雙方都抵賴,結果是大家都只被判1年。但是由於兩人處於隔離的情況,首先應該是從心理學的角度來看,當事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當·斯密的理論,假設每個人都是“理性的經濟人”,都會

從利己的目的出發進行選擇。這兩個人都會有這樣壹個盤算過程:假如他坦白,我抵賴,得坐10年監獄,坦白最多才8年;他要是抵賴,我就可以被釋放,而他會坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對我而言都是坦白了劃算。兩個人都會動這樣的腦筋,最終,兩個人都選擇了坦白,結果都被判8年刑期。

基於經濟學中Rational agent的前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被釋放就不會出現。這樣兩人都選擇坦白的策略以及因此被判8年的結局,納什均衡”首先對亞當·斯密的“看不見的手”的原理提出挑戰:按照斯密的理論,在市場經濟中,每壹個人都從利己的目的出發,而最終全社會達到利他的效果。但是我們可以從“納什均衡”中引出“看不見的手”原理的壹個悖論:從利己目的出發,結果損人不利己,既不利己也不利他。

納什均衡的重要影響

納什均衡理論奠定了現代主流博弈理論和經濟理論的根本基礎,正如克瑞普斯(Kreps,1990)在《博弈論和經濟建模》壹書的引言中所說,“在過去的壹二十年內,經濟學在方法論以及語言、概念等方面,經歷了壹場溫和的革命,非合作博弈理論已經成為範式的中心……在經濟學或者與經濟學原理相關的金融、會計、營銷和政治科學等學科中,現在人們已經很難找到不懂納什均衡能夠‘消費’近期文獻的領域。”納什均衡的重要影響可以概括為以下六個方面

(1)改變了經濟學的體系和結構。非合作博弈論的概念、內容、模型和分析工具等,均已滲透到微觀經濟學、宏觀經濟學、勞動經濟學、國際經濟學、環境經濟學等經濟學科的絕大部分學科領域,改變了這些學科領域的內容和結構,成為這些學科領域的基本研究範式和理論分析工具,從而改變了原有經濟學理論體系中各分支學科的內涵。

(2)擴展了經濟學研究經濟問題的範圍。原有經濟學缺乏將不確定性因素、變動環境因素以及經濟個體之間的交互作用模式化的有效辦法,因而不能進行微觀層次經濟問題的解剖分析。納什均衡及相關模型分析方法,包括擴展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經濟學家們提供了深入的分析工具。

(3)加強了經濟學研究的深度。納什均衡理論不回避經濟個體之間直接的交互作用,不滿足於對經濟個體之間復雜經濟關系的簡單化處理,分析問題時不只停留在宏觀層面上而是深入分析表象背後深層次的原因和規律,強調從微觀個體行為規律的角度發現問題的根源,因而可以更深刻準確地理解和解釋經濟問題。

(4)形成了基於經典博弈的研究範式體系。即可以將各種問題或經濟關系,按照經典博弈的類型或特征進行分類,並根據相應的經典博弈的分析方法和模型進行研究,將壹個領域所取得的經驗方便地移植到另壹個領域。

(5)擴大和加強了經濟學與其他社會科學、自然科學的聯系。納什均衡之所以偉大,就因為它普通,而且普通到幾乎無處不在。納什均衡理論既適用於人類的行為規律,也適合於人類以外的其他生物的生存、運動和發展的規律。納什均衡和博弈論的橋梁作用,使經濟學與其他社會科學、自然科學的聯系更加緊密,形成了經濟學與其他學科相互促進的良性循環。

(6)改變了經濟學的語言和表達方法。在進化博弈論方面相當有造詣的坎多利(Kandori,1997)對保羅·薩繆爾森(Paul Samuelson)的名言“妳甚至可以使壹只鸚鵡變成壹個訓練有素的經濟學家,因為它必須學習的只有兩個詞,那就是‘供給’和‘需求’”,曾做過壹個幽默的引申,他說,“現在這只鸚鵡需要再學兩個詞,那就是‘納什均衡’”。