论“囚徒困境”与解决方式
发布时间:2023-06-17 12:06:23浏览次数:43论“囚徒困境”与解决方式一、囚徒困境举例概述囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。 许多行业的价格竞争都是典型的囚徒困境现象,每家企业都以对方为敌手,只关心自己的利益。在价格博弈中,只要以对方为敌手,那么不管对方的决策怎样,自己总是以为采取低价策略会占便宜,这就促使双方都采取低价策略。如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。在国内的家电大战中,虽然不是两个对手之间的博弈,但由于在众多对手当中每一方的.市场份额都很大,每一个主体人的行为后果受对手行为的影响都很大,因此,其情景大概也是如此。如果清楚这种前景,双方勾结或合作起来,都制定比较高的价格,那么双方都可以因为避免价格大战而获得较高的利润。但是往往这些联盟处于利益驱动的“囚徒困境”,双赢也就成泡影。五花八门的价格联盟总是非常短命,道理就在这里。 并不是每次个人的“理性选择”都能让自我利益最大化,也许会让你陷入一个“囚徒困境”。大量例子说明,在“囚徒困境”中,常常是先动手的一方会占一些优势。那么,“先下手为强”吧。三、如何实现从个体理性走向集体理性1.非合作性博弈问题的解决就是寻求合作之路博弈可以划分为合作性博弈和非合作性博弈。他们之间的区别主要在于人们的行为相互作用
时,当事人能否达成一个有约束力的协议。如果有,就是合作博弈,反之,就是非合作博弈。合作博弈强调的是集体理性,是效率、公正、公平;非合作博弈强调的是个体理性,其结果可能是有效率的,也可能是无效率的。“囚徒困境”是非合作博弈的一个典型模型,“公地悲剧”同样也是个体理性导致的结果。一块公共的牧地本来可放 50 只羊,超过了这个放牧量就会导致这块公共牧地严重退化,最后的结果将导致这个牧场最后放不了羊。假设这块公地有 10 户人家,每户人的放羊是 5 头,但是每户选择的最优策略是放尽可能多的羊,因为他可以获取通过饲养牲畜所产生的直接受益,但是仅承担一部分来自过度放牧的成本。2.个体理性选择的结果将导致牧场严重退化,最终放不了羊。 非合作博弈有着一些基本假设,比如资源稀缺、经济人、共同知识和互相不信任等。资源的稀缺是人类生活的事实,自然界并不能主动满足我们的需要。经济人的理性行为仅仅考虑自己利益的最大化,然而由于资源是稀缺的,满足不了每个经济人的这种利益,结果是个体理性与集体理性之间产生各种利益冲突,当个体之间没有达成共识,互相之间不信任时,必然导致非合作性博弈,这是个体理性导致的集体非理性,个体的最大自然偏好也满足不了。在社会经济活动中,非合作博弈所产生的集体理性缺失往往造成效率低下。与非合作博弈相反的是合作博弈,亦称正和博弈,是指博弈各方的利益都有所增加,或者至少是一方的利益不受损害,而其他方的利益有所增加,因而整个社会的利益有所增加。合作博弈强调的是集体主义和集体理性,是效率、公平
和公正。如何克服不信任显然是个体理性走向集体理性的通路。关于非合作博弈的研究表面上是描述非合作的规律,更深的目标其实是寻找合作之路。事实表明,只有合作才有最佳的共同结果。 “个体理性”与“集体理性”均具相对意义,即“个体理性”中的“个体”不仅指自然人,也指大集团中的小团体,而“集体理性”中的“集体”在相对于更大的集团时,则转化为个人。从帕累托改进的意义上说,当集体成员的数量严格小于全体社会成员的数量时,个体理性与集体理性的冲突对整个社会来说就是一件“好事”,尽管它对该集体的成员而言是一件坏事。在囚徒困境中,尽管二人都坦白使囚徒集体的福利减小,但是对整个社会而言这是有益的。同理,令商家痛苦的价格战却使广大消费者从中受益。四、结语本文认为个体理性就是个体人在给定的约束条件下,最大化自己的偏好,而集体理性追求的基本价值是效率、稳定、公正公平,个体理性与集体理性往往是相互矛盾的。从“公共品供给不足”和“公地悲剧”两个典型例子中,我们可以看到,个体理性与集体理性之间存在矛盾,其根源在于再资源稀缺的背景下,个体没有约束的最大化自己的偏好,个体维护自己的利益而互相不信任,结果导致行为决策的不合作。这就需要在组织的框架下个体之间形成一套有效率的公正公平的制度,完成从个体理性到集体理性的通路。五、解决囚徒困境的方法在博弈论中有一个经典案例囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事 。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作 ,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚
犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。 那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A 犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了 。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以 A 犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A 犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。 在与其他企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况。解决方法就是进行重复博弈,也是动态博弈一种。比如,在一次静态博弈中,每一方为了达到自己的占优策略却导致了最坏的结果,即在占优均衡中总体利益和个体利益都下降了。如果采取触发策略进行重复博弈,一个成员背弃承诺,其他的都采取相同的不合作策略,并且一直进行下去 ,或者采取“以牙还牙”策略进行重复博弈,也就是参与人选择对手在上一时期的策略,这样下去 ,博弈的均衡解可能就会使总体利益最大。参考文献〔1〕刁文淇、曹丽娟《从个体理性到集体理性》.《科学与管理》2008 年.第 4 期〔2〕王苏珂《个体理性引发的集体非理性解读经济危机》.《东南大学学报(哲学社会科学
版)》 2009 年 6 月第 11 卷增刊〔3〕王则柯.《博弈论平话》.《中信出版社》. 2011. P26〔4〕梁伟.《博弈论视角下个体理性到集体理性的进路》.《湖北经济学院学报(人文社会科学版)》.第 6 卷第 10 期.2009 年 10 月〔5〕欧国立.《合作博弈、集体理性与城市交通效率》. 《中国地质大学学报(社会科学版)》.第9 卷第 1 期.2009 年 1 月(6)宋维佳. 《走出困境:公共品供给的博弈分析》.《辽宁大学学报(哲学社会科学版)》.第 31卷第 4 期. 2003.