身边的博弈论-博弈论与信息经济学浅说(doc65)-博弈论(编辑修改稿)内容摘要:

行分析,确定局势特征,找出其中关键因素,然后在最重要的目标上进行策略选择。 由此可见,博弈论种的策略是可以牵一发而动全身的,这直接对整个局势造成重大影响。 4)参与者拥有一定量的信息( Information)。 比如在“合纵连横”的故事中,秦国与六国之间所拥有的信息就是完全的。 但有些时候,信息并不是完全的,俗话说“天有不测风云”,比如今天是阴云密布、狂风大作,气象台预报明天是“阴转小雨”,明天出门上班到底要不要带伞呢。 这种情况的信息是不完全的,人们决策的信息条件是不确定。 当然从情理上说,在实际生活中一般是要带伞以防不测。 通俗的说,博弈就是个人或组织在一定的环境条件与既定的规则下,同时或先后,仅仅一次或是进行多次地选择策略并实施,从而得到某种结果的过程。 我们生活在这个世界上,就不可避免地要与他人打交道,这是一个利益交换的过程,也就无可避免地要面对各种矛盾和冲突。 所谓博弈论 听似 拗牙聱齿,看 似深不可测 ,但 其思想极易 理解。 简单说来博弈论就是研究,人们如何进行决策、以及这种决策的如何达到均衡问题。 每个博弈者在决定采取何种行动时, 不但要根据自身的利益和目的行事, 还必须考虑到他的决策 行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 2.博弈是一种竞合游戏 “ 博弈论”的英文是“ Game Theory”,实际上 Gme的本意是游戏,博弈论直接翻译成中文最贴切的直译是“游戏理论”。 更准确点说,是 一种竞合的智力 游戏。 所谓竞合,就是竞争合作的简写,一个博弈,并不仅仅是竞争,实际上竞争种包含着潜在合作的种子,合作中包含着潜在竞争的种子。 合作博弈并不是指合作各方具有合作的意向或态度,而是指在博弈中有一些对博弈各方有约束力的协议或契约,或者说是博 弈各方不能公然“串通”或“共谋”。 合作博弈最典型的例子就是石油输出国组织欧佩克( Organization of Petroleum Exporting Countries,简称 Opec),其 1960年 9月,由伊朗、伊拉克、科威特、沙特阿拉伯和委内瑞拉的代表在巴格达开会,决定联合起来共同对付西方石油公司,维护石油收入。 随着成员的增加,欧佩克发展成为亚洲、非洲和拉丁美洲一些主要石油生产国的国际性石油组织。 欧佩克协调和统一各成员国的石油政策,并以石油生产配额制的手段来维护它们各自和共同的利益 ,把国际石油价格稳定在 公平合理的水平上。 比如有些时候为防止石油价格飚升,欧佩克可依据市场形势增加其石油产量;为阻止石油价格下滑,欧佩克则可依据市场形势减少其石油产量。 智力游戏与博弈相近似的本质是,在确定游戏规则的约束下,游戏参与者决策、行动的过程。 各种智力游戏实际上就是一个实际社会、经济、管理、军事、政治等现象抽象出来的缩微模拟的模型。 在这个意义上 不妨说,博弈论 就 是 研究怎么 玩 好 游戏 的理论。 游戏是 一种 抽象。 面对复杂 现象 时,人们 经常会“ 见树 木 不见 森 林 ”,无法抓住某种现象的关键所在。 而在游戏中,可以 通过抽象 出现实 生活中的要点 ,并将 干扰因素减至最低,从而轻松地分析问题并找到合理可行的解决方法。 中国最古老的围棋最初的功能形态就是模拟战争。 围棋包含最多的是军事内涵,如围《身边的博弈论:博弈论与信息经济学浅说》 第 6 页 共 65 页 而歼之,生死存亡为先,争地夺利为上。 围棋以获得最大的利益为胜,抽象出战争的本质和目的,非常符合战争规律。 围棋游戏的规则极其简单,不过是两气生,一气死,附加帖目、打劫等辅助规则,最终以所占地盘大小定胜负。 但其作为一项智力游戏,与战争在很多方面都相通。 围棋棋手在小小棋盘上较量,就是战争、战场、战斗在棋盘上的演绎。 战争理念和战争指导思想是“基于毁伤”,以破坏、消耗、摧毁敌方 为上。 现代西方国家提出“基于效果”的作战思想,美国人将这一战争理念上的革命称为新的战争哲学。 基于效果就是,着眼于敌方整个作战系统的控制,使之丧失作战能力。 美军在伊拉克发动“斩首行动”的前一天,还专门召开了推出基于效果作战理念的新闻发布会,接着就发动了进攻。 围棋模拟出“基于效果”的战争理念,强调从全局上控制,而不是基于蝇头小利。 即所有的作战方法都必须是有效的,着子要看在全局中是否有用、有效 ,而不再是基于棋理、棋道、棋风等虚幻的在形式。 基于效果的思想就是赢棋第一,实事求是。 比如韩国棋手李昌镐就是基于效果的典范。 现在很多世界级公司都已经明白智力游戏的作用。 比如著名的微软公司在招聘员工时出过非常“儿童化”的招聘考题,题目是这样的:“某合唱团的 4名成员 A、 B、 C、 D往演出现场,他们途中要经过一座小桥。 当他们赶到桥头时,天已经黑了,周围没有灯。 他们只有一只手电筒。 现在规定:一次最多只许两人一起过桥,过桥人手里必须有手电筒,而且手电筒不能用扔的方式传递。 4个人的步行速度都不同,若两人同行,则以较慢者的速度为准。 A需花 1分钟过桥, B过桥需花 2分钟, C需花 5分钟过桥, D需花 10分钟过桥。 请问:他们能在 17分钟内过桥吗。 ” 这可不是微软公司的别出心裁,据说世界上许多跻身世界 500强的公司在招收新员工时,都要出类似的智力题。 智力游戏可以锻炼人的思维能力,培养人的思维方法。 良好的思维方法能使我们从错综复杂的现象中找到事物的本质,从纷繁的因素中找到事物变化的主要原因,使事物呈现出条理性。 思维方法是抽象的,它不像 1+ 1= 2那么简单,只有通过自己的想像,亲自动手操作,经历失败,才能逐步形成。 思维科学化程度越高的人,工作中发现问题、解决问题的能力就越强。 这一点已成为人们的共识。 在许多智力游戏中,都存在这么一个共同的特点,就是参与者所 选择的策略对于胜负有着举足轻重的影响。 一个游戏一点规则制订好之后,策略选择的好坏就成了游戏参加者所能自由运用的左右游戏结果的最关键因素。 特别是在围棋、象棋之类参与者的初始条件完全相同的游戏中,策略选择就成了游戏结果的唯一决定因素。 至于从围棋初段段到九段之间的差别,从博弈论的角度去看,就是他们之间策略选择的技巧高低不同而已。 博弈论的策略思维 是 一种技巧。 策略思维从 一些 基本技巧出发,考虑的是怎样将这些基本技巧最大限度地发挥出来。 任何游戏都有自己的规则 ( Rule of the game)。 实际现实 自然也是如此, 这就是法律、道德和各种成文或不成文的规章制度和惯例等。 当然,这些规则也不是一成不变的,它会随着情况的改变和人们的要求不断 修正 ,但是只要规则存在, 这个规则就是确定了人们行为的前提条件。 因此博弈与游戏都有一个重要的共同特征,那就是这些规则规定游戏参加者可以做什么,不可以作什么,按照什么次序去做,什么时候结束游戏,一旦参与者犯规将受到怎样的处罚等。 游戏者的策略有相互依存的关系。 每一个游戏者从游戏所得结果的好坏不仅取决于自身的策略选择,同时也取决于其它参加者的策略选择。 有时甚至一个坏的策略会给选它的一方带来并不坏 的结果,原因是其它方选择了更坏的利他而不利己的策略。 这一点也是游戏与博弈重要的相似之处。 《身边的博弈论:博弈论与信息经济学浅说》 第 7 页 共 65 页 3.博弈论不是“万金油” 博弈论并不是“万金油”,正如 诺贝尔经济学奖得主莱因哈德 泽尔滕教授 所说, “ 博弈论并不是疗法,也不是处方,它不能帮我们在赌博中获胜,不能帮我们通过投机来致富,也不能帮我们在下棋或打牌中赢对手。 它不告诉你该付多少钱买东西,这是计算机或者字典的任务。 ” 要求博弈论能够完全刻画真实的世界 ,那么 这 命中注定会徒劳无功。 根据著名的哥德尔不完备定理,任何一个理论体系必定是不完全的,任何理论包含了既不能证 明为真也不能证明为假的命题。 对这个世界的最好描述可能只有其本身, 但是正如 罗宾逊夫人 的 妙语 “ 比例尺是一比一的地图是没用的 ”。 博弈论也是这样,博弈论力图用最简单的假设下得到最大范围的推理应用。 博弈论的这种方法与很多应用广泛学科都是相似的。 如欧几里德几何的基本假设是两点之间直线,推演出庞大而严密的几何体系,可以说,在生活中或工程应用中,欧几里德几何学的思想方法是无处不在、无时不有。 其基本公设之一就是,人是理性的( rational)。 所谓理性的人是指行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。 而现实生活中,人们再做决策时往往是有限理性。 所谓有限理性,也就是说人不是机器,人的理性是有限度的。 比方说,某人要签署一份合同,有三种方法可供选择:一种是计划好,安排好一切,然后不动脑筋按部就班地照计划进行;另一种是做进度安排的时候都留一点余地,可供签订合同双方私下协商解决:最后一种是完全没有安排,凭着当时的感情与直觉任意为之,这种方法当然不可能是理性的。 后两种一眼就可看出完全不满足博弈论意义上的理性,即使是第一种方法也不是真正意义上的经济理性。 这是因为人们很难对每个措施将要产生的结果具有完全的了解和正确 的预测,常常要在缺乏完全了解的情况下,一定程度地根据主观意识进行决策,个人或企业的决策都是在有限理性的条件下进行的。 完全理性,意味着对每个抉择的确切后果都有完完全全的了解。 事实上,一个人对自己的行动条件的了解,从来都只能是零碎的;至于使他得以从对当前状况的了解去推想未来后果的那些规律和法则,他也是所知甚微的。 人类的精力和时间永远是有限的,人不可能具备完全理性,不可能掌握所有知识和信息。 人类也不可能搜寻到所需的全部的信息。 另一方面也要意识到信息的搜寻需要成本,而不是毫不费成本的,因为人类必须为此付出大量的时 间、精力和财力等等。 意图搜寻到所有信息,企图做出收益最优的决策行为有时反而是最不理性的行为。 但 当 我们退而求其次 时 , 博弈论可以得到 对现实的客观 世界 描述的近似。 所以 博弈论 仍然 是我们目前所能得到的最好但非唯一的工具。 就像并不完美的力学是自然科学的哲学和数学一样,博弈论是社会科学的力学和数学。 没有牛顿力学我们连最简单的物理现象都无法理解,马用了多大的力拉动一车货物。 上帝说“让牛顿来做吧”,于是我们知道了马用的力相当于克服摩擦力。 同样的道理,没有博弈论我们也无法解释分析很多现实的社会现象。 著名的博弈论 大师 鲁宾 斯坦 ( Rubinstein)说过 , “ 一个博弈模型是我们关于现实的观念的近似,而不是现实的客观描述的近似 ”。 看来“ 理论之树是灰色的,生命之树常青。 ”这句话,我们应该谨记于心。 《身边的博弈论:博弈论与信息经济学浅说》 第 8 页 共 65 页 第二章 纳什均衡、纯策略与混和策略 1.从围棋定式谈纳什均衡 我们已经知道, 博弈论的基本前提 是, 某人或某物的行为效果如何,有赖于他人或他物的行为。 由于世上人间的事物很少不依赖于其他事物而存在。 非合作 博弈强调利益的冲突,即非合作甚至对抗状态。 比如, “ 零和 博弈”就是典型的非合作博弈,它是指博弈各方的所得之和为零,在特殊情况下如两人博弈时,一 方所得与另一方所失相等。 从严格的数学角度来看,围棋 1919 的 361 个交叉点就是围棋对弈者所得的总和,因此围棋棋手非输即赢,可见围棋明显是数学意义上的严格的零和博弈。 世事 如棋局,而棋局是可以用 博弈 思维加以概括的。 比如过分 的“骗着” , “ 本手 ” 与 “ 缓着 ” 之间,一般都会选择本手,着法过分如不遇反击,可能占到便宜,如遇反击则可能亏损,因此如果棋力相当,则应考虑到对手的反击手段。 对手也同样考虑到在追求利益中不可能占尽便宜。 这就导致双方都能接受的方案。 围棋定式 从策略层面看,如一方的策略是 抢占实 地,另一方是 获得外 势, 而结果相当,互有所得,双方就愿意那样下。 抢占实 地考虑现实利益, 获得外 势考虑将来发展 ,这 便形成一个 双方的“均衡” ;另一方面,可以从具体行棋效果来看,如果一步棋能考虑到对手各种应手而依然成立,对手也运用同样法则找到应对,则可以说双方达成了 “ 均衡 ”。 在经济学中,均衡 (equilibrium)意即相关量处于稳定值。 比如在经典的供需分析中,若某一商品的市场价格使得欲购买该商品的人均能买到,同时想卖的人均能将商品卖出去,此时该商品的供求达到了均衡。 这个市场价格可称之为均衡价格,产量可称之为均衡产量。 均衡分析是经典经济 学中的重要方法。 在讲解纳什均衡之前,我们再来看这样一个例子。 一般对博弈论稍微有些了解的人,都会知道“囚徒困境”这个名词。 这个例子就是在“囚徒困境”的基础上所作的修改。 A 和 B 是两个因盗窃而被抓的惯犯。 警察局局长 C 正在调查该局管辖区域内的一宗悬而未决的银行抢劫案,并且他根据一系列的线索判定 A 和 B 是这桩案子的凶犯。 因为该局管辖地区治安一向混乱不堪, C 的上级对 C 非常恼火,直接威胁 C 如果银行案破不了,就要撤销 C 局长的职位,给予降级惩罚。 C 在上级的压力下不得不耗费大量时间、精力提审 A和 B。 为了能够让两个囚犯认罪, C 想让 A 和 B 明白,假如只有他们其中的一人坦白认罪则这个人可能受到的最严厉的惩罚是什么,但向他们遵守承诺,若两个人都坦白,则会从轻发落。 于是,这个警察局长 C 分别与 A、 B 立下许诺:如果只有一个人坦白认罪,则认罪的一方会收到所有指控,会因银行抢劫而判无期徒刑,另一个人则不会再加刑罚。 如果无人认罪,两个人都会因盗窃罪而判刑 2 年。 如果两个人都坦白,则两个人都被判处有期徒刑 5年。 这样,警察局长 C 给 A 和 B 构造了一个博。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。