栖息谷-管理人的网上家园

[谈天说地] 深圳

[复制链接] 6
回复
1444
查看
打印 上一主题 下一主题
xzf
楼主
跳转到指定楼层
分享到:
发表于 2003-3-7 11:45:00 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
001 博弈论与诺曼底战役决策
普林斯顿大学的一道习题
   题目:如果给你两个师的兵力,由你来当“司令”,任务是攻克“敌人”占据的一座城忆而敌军的守备力量是三个师,规定双方的兵力只能整师调动。
通往城市的道路只有甲乙两条。当你发起攻击的时候,你的兵力超过敌人,你就获胜;你的兵力比敌人的守备兵力少或者相等,你就失败,那么,你将如何制定攻城方案?
“司令”发牢骚躺倒不干:“为什么给敌人三个师的兵力而只给我两个师?这太不公平,兵力已经吃亏,居然还要规定兵力相等则敌胜我败,连规则都不公平,完全偏袒敌人。”为此你也许会大为不满。来个躺倒不干。
其实,这次模拟“作战”,每一方取胜的概率都是50%,即谁胜谁负的可能性是一半对一半。你这个司令能否神机妙算,指挥队伍克敌制胜,还得看你的本事。
为什么说取胜的概率是一半对一半呢,让我们先学一点儿“纸上谈兵”。
我们来分析一下:敌人有三个师,布防在甲乙两条通道上。由于必须整师布防,敌人有四种部署方案,即:
A,三个师都驻守甲方向;
B,两个师驻守甲方向,一个师驻守乙方向;
C,一个师驻守甲方向,两个师驻守乙方向:
D,三个师都驻守乙方向。
同样,你有两个师的攻城部队,可以有三种部署方案,即:
a,集中全部两个师的兵力从甲方向攻击:
b, 兵分两路,一师从甲方向,另一师从乙方向,同时发起攻击;
c,集中全部两个师的兵力从乙方向攻击。
和以前一样,如果我们用“+,-”表示我方攻克,用“-,+”表示敌方守住,就可以画出交战双方的胜负分析表:
  敌
我   A          B           C              D
a         -,+    -,+       +,-      +,-
b        +,-     -,+       -,+      +,-
c          +,-  +,-       -,+       -,+
                   

假设你采取a方案,那么如果“敌人”采取A方案,你的两个师将遇到敌军三个师的抵抗,你要败下阵来,所以是(一,十);如果“敌人”取B方案,你的两个师遇到敌军两个师以逸待劳的抵抗,你也要败下阵来,同样是(一,+);但是如果“敌人”取C方案,你以两个师打“敌人”一个师,你就会以优势兵力获得胜利,结果是(十,一);同样,如果“敌人”采取D方案,你攻在敌军的薄弱点上,你就能长驱直入,轻取城池,结果也是(十,一)。
和以前的博弈表示略微不同的地方,是现在每个格子里面只有正负号,没有数目字。希望这不会使你感到不安。如果你还是喜欢有数目字,那也容易得很,每个正负号后面都加上同一个数目字就行,同一个1.同一个1944,或者同一个1998。要紧是表达出输赢。
这你就知道,在上述表达中,正负号要紧,具体数目字无所谓。
诺曼底登陆模拟:取胜概率相等
交战双方的胜负分析表画出来以后,从…,一”的分布来看,似乎双方取胜的机会都一样大。一直看《博弈论平话》的读者,可以运用劣势策略消去法把它化简。
实际做这个题目的时候,如果先从我方入手一下于是分不出优劣来的。a和b,b和c,a和c之间,都说不上谁比谁优,谁比谁劣。于是我们从敌方入手,尝试站在敌军的立场,比较策略A和B。如果我军采取策略a,敌军取A或B都会赢,结果一样。如果我军采取策略b,敌军取A会输取B会赢,如我军采取策略c,敌军取A或B都会输。可见,在敌军看来,策略B比策略A好:采取策略A会赢的话(如果我军取a),采取策略B一定也会赢;采取策略A会输的话(如果我军取b或c),采取策略B却不一定会输,因为假如我军取b,敌军就赢了。
同样,策略C和D比较,C是优势策略,而D是劣势策略。
智慧的或者说理性的局中人是不会采用劣势策略的,所以当做出博弈的矩阵表示以后,如果发现劣势策略,你就可以把它划去,这就是劣势策略消去法。
现在,剩下上边那个三行两列的矩阵,六个格子中,(一, +)比(十,一)多,似乎敌方的赢面比较大,其实不然。因为到了敌方不会采用“笨蛋”策略的时候,到了敌方只剩下B和C两个较优策略的时候,我方的三个策略之中,原来不是劣势策略的b现在就变成劣势策略了。我们也不是笨蛋,所以我们也应该把b删去。最后,得到下边那个两行两列的矩阵博弈表示。
情况最终就是这样:敌军必取B或C那样的二一布防,一路两个师,另一路一个师,而我军必集中兵力于某一路实施攻击,即a或c那样的攻击策略。这样,你若攻在敌军的薄弱处,你就获胜,你若攻在敌人兵力较多的地方,你就失败,总之,敌我双方获胜的可能性还是一样大,“司令”先生:不要躺倒不干,你不比对方吃亏。
这虽然是一个模拟的例子,却具有相当的现实意义,诺曼底战役前的情况,大体也是这个样子。跨海作战,攻方能够调动来渡海作战的兵力,通常总是比守方可以用于守备的兵力少。模拟作战中假设攻方兵力力两个师而守方的兵力为三个师,就是这样的背景。另外,渡海登陆作战,通常至少在一开始的时候,攻方要承受很大的牺牲。模拟作战中规定若攻守双方兵力相等则攻方失败,体现了这个意思。
002 博弈论简介
"对于一些非数学专业和经济学专业的人们来说,博弈论可能是一个极为陌生的概念。事实上,就是一些经济学专业毕业的学生,他们的博弈论知识也十分有限,我自己也是这样,略知皮毛而已(不,甚至连皮毛都未能真正了解)。因为国内学者把博弈论运用于经济学研究不过是近几年的事,也不普遍,而且它本身的内容也博大精深。但在国外,博弈论已成为占据主流的分析工具,如果你不懂得博弈论,那么你会被认为是没有真正懂得经济学。
   博弈论的提法可能太过于学术化,容易让人们退避三舍。其实它有一个非常通俗的名字——游戏理论(博弈论的英文名字叫做“Game Theory”,如果直译,就是“游戏理论”)。博弈论在我国还有一个名字,叫对策论。这些名字都很好理解,博弈字面意思就是赌博、下棋,赌博和下棋当然是游戏了,赌博和下棋的时候常常要千方百计地应付对手,自然是要讲究对策了。
   如果我们要进行一场游戏,首先肯定要有参加游戏的人,没有人参加,游戏就不会进行下去,游戏活动的参与人有一个学术名称叫“局中人”;其次,每一个“局中人”都有自己的“行动”,或者叫做“策略”、“对策”,如果行动不是单一的,那么这个局中人所有的行动构成一个集合,称行动组合或策略组合;另外,还应该约定输家要付出什么代价,赢家可获得什么利益,这在术语上叫做“支付”(或“报酬”)。当然,一场游戏肯定结果不是唯一的,各个参与人分散决策采取不同的行动,会造成不同的结果。但是纳什证明出,在有限个局中人参加的有限行为对策中,至少存在一个所有参与人的最优战略的组合,这叫做“纳什均衡”。处于纳什均衡状态下,每个人都不能通过改变策略来得到更大的收益,所以谁也不存在改变现状的动力。
    举一个具体的例子来说明一下。这个例子叫“囚犯困境”,是被一些教材广泛引用的例子,并且西方经济学者围绕这个例子发表过不下百篇学术论文。它是这样的(有兴趣的读者可参见青年经济学家张维迎的《博弈论与信息经济学》,这本书几乎成了经济学研究生的必读书):两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白各判8年,如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年,如果都不坦白则因证据不足各判1年。
    在这个例子里,局中人就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。我们可以用下面的表来表述这个博弈,表中,第一个数字是A的支付(因为是判刑是负效用,故以负号记之),第二个数字是B的支付。
   囚犯B  
  坦白 抵赖
囚犯A 坦白  -8,-8  0,-10
抵赖 -10,0 -1,-1
我们看到,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。
    张维迎指出,囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个“攻守同盟”,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。
    “囚犯困境”在经济学上有很多应用,也有力地解释了一些经济现象。比如中东石油输出国组织(Organization of Petroleum Exporting Countries,简称OPEC)的成立,本身要限制各石油生产国的产量,以保持石油价格,以便获取利润。但成员国并不遵守组织的协定,每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失。当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降——结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌……我们不妨考察一下历史:
    1960年,5个产油国成立欧佩克(OPEC)。1973年成员国扩大到13个。当时各国还少有产量欺骗行为。1973年,阿-以战争爆发,为了报复以色列和西方国家,OPEC突然大幅度削减石油出口,致使世界原油价格由$2.91/桶暴涨到1974年$10.77/桶。这一意外事件让OPEC看到了组建卡特尔的诱人前景。1978年伊朗发生革命,其石油生产一度陷于瘫痪,既而两伊战争爆发,许多石油设施受到破坏,世界石油价格进一步涨到80年代初的$40/桶。但是,高额的利润导致各个国家的产量欺骗行为(实际产量大于限产计划),即各国不再遵守产量协定,擅自提高产量以获取更大的市场和更多的利润,从而导致石油价格下跌——当然,价格下跌也与世界其他地区如墨西哥油田、阿拉斯加油田、北海油田等石油供给增加有关。1982年世界石油价格为$32/桶,1984年为$27/桶,1987年为$18/桶,以后基本上在$15-18/桶之间波动。
   理论上,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。最近发生的一个案例再次证明了这一点。今年4月,长虹突然宣布彩电降价,对彩电业带来了巨大震动。随即,康价佳老总陈伟荣、TCL老总李东生、创维老总黄宏生达成默契:建立彩电联盟。直到4月20日下午,康佳仍表示不降价,但当晚陈伟荣突然改变主意,搞得李、黄措手不及。4月24日,本来三方准备坐下来商讨降价后的进一步策略,结果又是陈伟荣爽约。
    那么不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。但只要是有限次的合作,合作就不会成功。比如合作10次,那么再第九次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。但是大家料到第九次会出现不合作,那么就很可能再第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作……一直到,从第一次开始大家都不会采取合作态度。

当然,这只是理论上的分析。现实中影响人们决策和态度的因素很多,所以,有些博弈的结果并不体现为纳什均衡。在国外曾做过一个“囚犯困境”的实验,被实验者是素未谋面的一个男生和一个女生。开始,这个男生每次都选择“坦白”,这是符合纳什均衡的。后来实验者有意安排了一次喝咖啡的机会,使男生发现自己的对手是一个漂亮的女生。结果以后的测验中,男生每次都选择不坦白以获取女孩的好感。
     不过,不管怎样,博弈论都是一个强有力的分析工具。现在,它不仅在经济学领域得到广泛应用,在军事、政治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响,工程学中如控制论工程也少不了它。我们举的例子,只是帮助大家形成博弈论的基本概念,实际上它是非常精深的。现在与它紧密联系的经济学分支是信息经济学。信号游戏、拍卖形式、激励机制、委托人—代理人理论和公共财政学是博弈论和信息经济学研究的重要课题。
   应该感谢美国数学家冯?诺依曼(Von Neumann)和摩根斯坦(Morgenstern),是他们在《博弈论和经济行为》(1944)一书中提出了博弈论的经济思想。冯?诺依曼在数学、计算机、经济学等领域都有奇才般的贡献,可惜英年早逝。1950-1954年,美国数学家统计学家纳什接连发表多篇论述对策论的文章,奠定了现代博弈论学科体系的基础。
沙发
发表于 2003-3-8 00:48:00 | 只看该作者
顶一个!
板凳
发表于 2003-3-8 11:25:00 | 只看该作者
楼上好帖!

同时我觉得这样的好帖如果改用类似“博弈论与诺曼底战役决策”做标题是否会更好一些 ?

我是个喜欢完美的家伙,觉得最好在标题里即讲出主题,楼主看呢 ?
4
发表于 2003-3-14 10:23:00 | 只看该作者
好贴!我强烈顶一下!
5
发表于 2003-3-14 18:20:00 | 只看该作者
DDDDDD!好贴!
6
发表于 2003-3-14 23:17:00 | 只看该作者
想起来学校里的时候,那些智猪顶牛什么的,呵呵
很有意思
感觉又回到了凤凰花开的地方
顶一下


[此贴子已经被作者于2003-3-14 23:28:46编辑过]
7
发表于 2003-3-17 11:21:00 | 只看该作者
有没有系统介绍或者学习资料阿?

使用高级回帖 (可批量传图、插入视频等)快速回复

您需要登录后才可以回帖 登录 | 加入

本版积分规则   Ctrl + Enter 快速发布  

发帖时请遵守我国法律,网站会将有关你发帖内容、时间以及发帖IP地址等记录保留,只要接到合法请求,即会将信息提供给有关政府机构。
快速回复 返回顶部 返回列表