博弈论的研究对象与基本方法
发布时间:2023-06-05 09:06:33浏览次数:74博弈论的研究对象与基本方法摘要:博弈论是一种为竞争现象出谋划策的理论。无论是在现实工作生活中,还是科学领域中,许多现象或行为之间都存在着博弈。本文对博弈论的定义与发展进行梳理,阐释了博弈论的研究对象,指出博弈论的应用领域,最后提出博弈论的基本方法。关键词:博弈论;研究对象;基本方法一、博弈论的定义与发展博弈论,也叫对策论,是关于竞争现象的分析工具及理论方法。在博弈中,参与者的行动之间互相作用互相影响,最终找到一种均衡以解决问题。当参与者(一个人或一家企业)的行为选择与其他参与者的选择互相影响的时候,如何进行抉择并找到解决这种现象的最好方案,达到均衡,是博弈论所要研究的主要问题。由于竞争现象太多,以至于博弈论在很多领域有着重要的理论分析作用,如在政治经济领域、军事领域等都发挥着积极的推动作用。下面我们了解一下博弈论的发展。博弈论理论在我国古代的《孙子兵法》这一著作中就有被提到,最初分析的是赌博、“剪刀石头布”等中的输赢问题,对博弈论的研究只是处于经验的基础上,把博弈理论系统化一门学科始于上世纪初。博弈论被普遍认为建立于 20 世纪的中叶,冯诺依曼(Von Neumann)对博弈论进行了论述证明。它是经济分析工具,使得经济学发生了巨大的变化。在《博弈论与经济行为》这本著作中,将博弈理
论进一步深化,扩展为超过两个人的博弈。还提出了合作及非合作博弈,使理论逐渐成熟。这本著作是他与摩根斯坦一起创作的。20 世纪 50 年代,博弈论处于发展阶段,纳什(Nash)在他有关博弈论的著作中,提出纳什均衡的定义并对其存在性给予了证明,为非合作博弈提供了很好的基础。60 年代,博弈论开始走向成熟,延伸到了信息不全都公开的博弈的领域,对其理论概念及应用有了较完善的整理。80 年代,出现了很多有关博弈论的主要研究成果。如今,博弈论终于发展为较完善的一门学科,应用范围非常广。二、博弈论的研究对象博弈论根据看问题的方式不同研究对象来进行分类:合作与非合作博弈:协调合作的参与者之间定下了一个必须遵守的规章,在这个条件的限制下,共同行动。大部分的非合作博弈的结果都不能令人完全满意,而合作就会得到更好的结果。但实际操作中,合作比较复杂,且不一定具有稳定性。在频谱分配中,常常用到的是非合作;静态与动态博弈:若博弈者是一起做出决定的话,就是静态博弈;若是有先有后地做出决定的话,先做出决策一方的信息可以让后来的人知道,那么就是动态博弈;完全与非完全信息博弈:博弈的信息包括行动集合、策略、效用等。如果所有这些信息是毫无保留地公开的,就是完全信息博弈;若不公开或不完全公开,为非完全信息博弈。三、博弈论的应用领域博弈论的英文名称为“Game Theory”,原意是游戏的理论。因为关于博弈论的思想最先起源于对于游戏过程的研究。比如在扑克牌的游戏中,每个参与者在思考出牌策略的过程中都会考虑其他参与
者可能的选择,而其他参与者也会相互之间进行猜测。即便在每一局游戏中每个参与者手上都有一样的牌,而他们不同的出牌策略会导致很不一样的结果。又比如在足球比赛中,球员靠近球门的时候准备射门,这个时候守门员如果等球踢出过后再根据球的运动方位来决定朝哪个方向防守的话,是没有反应时间的,他要根据球员射门的动作在球发出之前就要考虑向哪个方向扑球。基于这种情况,射门者在发球前一瞬间可能会有假动作,比如准备朝右边踢,从而诱导守门员往右边扑球,而最终却往左边发力,导致射门者一方得分。当然聪明的守门员可能会看穿射门球员可能会是假动作,当对方准备往右边射门时,却扑向左边,反而有效的防止了对方进攻。而对于射门球员来说,他也知道守门员可能会看穿他的假动作,从而不使用假动作而直接踢向右边让对方扑空。那么经过多个回合的比赛过后 ,很可能的情况是,射门的一方以一定的概率把球踢向左边或者右边,而守门员以一定的概率往左边或者右边防守。实际上中国古代著名军事家孙膑就可以算是一个博弈大师。他认为两国之间的较量并不一定要将对方消灭,更重要的是如何避免造成两国的共同损失。他在其著作《孙子兵法》中指出,交战过程中一方要揣摩对方的军事策略,从而做出自己的最优选择,而对方也可能猜测到己方的应对策略,从而做出相应的战略调整,双方相互牵制,相互影响。虽然这是一部军事著作,但从策略分析的角度而言 ,已经包含很多现代的博弈思想。博弈思想在经济领域也很早就有涉及,尤其是在不完全竞争领域。比如在通常的微观经济学中我们所熟知的卡特尔模型,就是运用博弈思想的一个典型。在卡特尔模型中 ,厂商之间可以通过对某一类产品共同制定价格和分配产量,可以使各厂商形成一个垄断联盟,从而获
取高额利润。但是厂商的本性是追逐更高的利润,在这样的动机下,各厂商会私下增加产量,降低产量。因为当其它厂商遵守协议时,某一厂商这样做就会增加其利润,如果其它厂商都这样做而它自己却遵守协议,就更会处于不利地位,所以无论其他厂商如何选择,偷偷降低价格增加产量都是该厂商的最优策略。而当所有的厂商都这样做时,必然导致各厂商只能获得较低的利润,所以说卡特尔组织是一种不稳定的组织。更进一步说,本例实际上是对博弈论中囚徒困境模型的运用。四、博弈论的基本方法(一)古诺(Cournot)模型古诺模型,又称为双头垄断理论,法国数学家安东尼·奥古斯丁·古诺(Antoine Augustin Cournot,1807-1877)在《财富理论的数学原理研究》研究两个泉水企业之间对产量的竞争中首次提到了古诺模型。模型中,生产的数量是所有决策者的战略集合。若每一个企业的产品是一样的,边际成本为常数 。那么为达到利润的最大,往往会以总体利益最优为目标求出产量总和,然后企业再平分这个生产和。不过这种分法很容易出现分歧,企业都会为自己利益而有意愿不遵守。这是由于如果两家企业合在一起制定产量计划,那么由此得出的应生产的数量会少。产品供应量越少,对应的市场定价会越高。产品价格提升,所有企业都会不顾后果想增加产量。这样市场的总供应量增加了,产品价格又会随之下降。古诺模型就会避免这种不稳定现象的产生。它所得出的均衡点,两企业的产量和会比上述平分方法的要高,从而价格也会下降。关键是没有企业会背离这个均衡。(二)伯川德(Bertrand)模型这也是一种信息为全公开的静态博弈。它考虑的也是两个厂商成产同样的商品,与古诺不同的是
博弈者以商品定价作为策略。这里将市场对该产品的需求定义为商品价格的函数。在满足这些需求下 ,根据定价获得的收入减去成本,就是厂商的效用。最后为实现各自效用最大化,确定如何给商品定价。(三)斯坦克尔伯格(Stackelberg)模型这是一种完全信息的,动态博弈。设厂商 1 先做出决策,且知道自己的信息会被厂商 2 得到。厂商 1 的决策为厂商 2 策划自己的行动的参照。他们用于竞争的策略可以是产量,也可以是对产品的定价。若以定价为策略,那么先行动的厂商 1 的效用会低于厂商 2 的效用,后定价的人会比较有优势;若以产量作为策略,先做出决策的人的效用比较好。(四)重复博弈模型重复博弈就是进行不止一次的博弈。这里,博弈者可以掌握历史信息,即上一次博弈参与者的行动、效用等等。依据历史战略的信息,做出当前的博弈策略。可以看出,重复博弈的复杂性要大于一次博弈,它的策略空间也会较大。与一次博弈相比,会找到更好的均衡。重复博弈重点关注的是长远利益。参考文献[1] 许纯祯,吴宇晖,张东辉 . 西方经济学 [M]. 北京高等教育出版社,2008:100-110.[2] 朱弗登博格, 让梯若尔. 博弈论[M].北京: 中国人民大学出版社,1996.[3] 张维迎. 博弈论与信息经济学[M].上海人民出版社,2004:1-10.[4] 杨荣基,彼得罗相,李颂志.动态合作:尖端博弈论[M].中国市场出版社,2007:7-13.[5] 汪贤裕,肖玉明. 博弈论及其应用[M].北京:科学出版社,2008:23-28.