栖息谷-管理人的网上家园

纳什均衡和博奕论

[复制链接] 0
回复
1125
查看
打印 上一主题 下一主题
楼主
跳转到指定楼层
分享到:
发表于 2003-8-4 13:44:00 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
纳什均衡和博奕论
纳什均衡是博奕论最重要的理论。
举个简单的例子来说明博奕论是什么?
你在一个屋子里,屋里有很多人。这时候,屋里突然失火,火势很大,无法扑灭。此时你的目的就是逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?——这就是博弈论!
你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果(博弈论称之为支付pay off),不仅取决于你的行动选择(博弈论称之为策略选择),同时取决于他人的策略选择。你和这群人构成一个博弈(game)。
博弈论对人的基本假定是:人是理性的(rational)。所谓理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。
中国人对博弈论有天生的了解。正如中国人常说的“事事洞明皆学问,人情练达即文章”,即是说人与人之间的关系、社会交往均是学问。而中国很多“做人”的道理,道出了如何在人与人的博弈中获取成功。罗贯中的《三国演义》在今天看来就是一部博弈论教材!无论是兵书如《孙子兵法》、《三十六计》,还是现代流行的所谓 “厚黑学”,都是关于如何赢得与人交往的胜利的,或者说如何获取成功的.
博奕论中流传最广的是一个叫做“囚徒困境”的故事。说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放。而他的同伙就会被判10年。如果双方都与警方合作共同招认,则各被判5年。如果双方均不承认有罪,因警察找不到其他证据来证明他们以前的违法证据,则各判3个月。这两个小偷将如何选择。如图示:
乙\甲   抵赖    坦白
抵赖   判3个月  乙:10年
           甲:释放
坦白   甲:10年  各5年
     乙:释放
他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。但是由于两人处于隔离的情况下无法串供。这样两人都选择坦白的策略以及因此被判5年的结局就被称为“纳什均衡”,也叫非合作均衡。也就是说一策略组合中,所有的参与者面临这样的一种情况,当其他人改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的支付将会降低。
“纳什均衡”首先对亚当•斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。
从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下规律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。

使用高级回帖 (可批量传图、插入视频等)快速回复

您需要登录后才可以回帖 登录 | 加入

本版积分规则   Ctrl + Enter 快速发布  

发帖时请遵守我国法律,网站会将有关你发帖内容、时间以及发帖IP地址等记录保留,只要接到合法请求,即会将信息提供给有关政府机构。
快速回复 返回顶部 返回列表