论“囚徒困境”与解决方式
发布时间:2023-06-09 09:06:18浏览次数:34论“囚徒困境”与解决方式一、囚徒困境经典案例分析囚徒困境的内容是这样的:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监 10 年。若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。若二人都互相检举(互相“背叛”),则二人同样判监 2 年。用表格概述如下: 甲沉默(合作) 甲认罪(背叛)乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑 10 年乙认罪(背叛)甲服刑 10 年;乙即时获释二人同服刑 2 年在上图中,甲、乙分别代表本博弈中的两个博弈方,也就是两个罪犯;他们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果
(各判 2 年),并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境”。“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现 。但是这样的分析是基于单次博弈的基础之上,而在重复的囚徒困境中,博弈会被反复的进行,因而没个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。一 二、生活中类似的例子如两个企业打价格战,双方都不降价的话双赢,一方降一方不降则一盈一亏,但最终的博弈结果一定是双方都降价,导致双方亏损。两个企业打价格战,双方都不降价的话双赢,一方降一方不降则一盈一亏,但最终的博弈结果一定是双方都降价,导致双方亏损。2012 年 8 月 15 日上午 9 时,京东、苏宁易购、国美电器网上商城等 3 家又开始了一场新的价格战。这样的三国大战缘于前一天的微博。8 月 14 日,京东商城 CEO 刘强东在新浪微博上称,京东大家电未来 3 年内零毛利,并且京东的大家电保证比苏宁、国美便宜至少 10%以上。这条微博引起了苏宁易购执行副总裁李斌的回应,他称,苏宁易购包括家电内的所有产品的价格都将低于京东,并且,还会保持最大力度的促销行动。此后,国美应声加入,表示国美电器网上商城全线产品价格将比京东商城低 5%。库巴副总裁彭亮
接受记者采访时称,为了扩大库巴持续低价的影响力,国美旗下库巴网最终也选择加入这场价格战。消费者最初知道京东是因为他的 3C 产品,最初知道当当是因为他的书,最初知道红孩子是因为他的母婴用品……很多的电商企业在发展之初,都坚持了一个核心定位。但是随着用户规模越来越大,为了实现规模效应,这些电商巨头们都纷纷开始向平台化转变,不断的要销售数据、不断的要增长规模,而这一切都在表明:这些企业越来越倾向于自己的回报能从资本市场上获取,而不是最终的消费者市场。于是,为了要销售数据,为了要增长规模,更加“惨烈”的价格战无穷无尽,电商巨头们也很难从“囚徒困境”中脱身!价格战无疑“伤敌八百,自损一千”,打破这种战术困境,成为了整个中国电商行业都急需解决的问题。尽管,提升客户关系管理、实现差异化竞争、提升服务质量等等道理大家都明白,但真正要做到这些,长路漫漫其修远兮。三、个性理性和集体理性:博弈论视角(一) 首先要明确的是“什么是个体理性”。博弈论在英文里面就是游戏理论.它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题 憾弈论可归为经济理论的范畴.它和古典经济学一样有一个预设前提就是“理性人”经济学称为经济人)。因此博弈论里的决策主体可以理解为明智的、理性的 “所谓理性人就是有一个很好定义的偏好.在面临给定的约束条件下最大化自己的偏好 ”这里决策者的理性就是说决策者“前后一致地”做出选择。显然。一个前后一致的决策者可以这样来描述:在给定他(她)对于“外部环境”的信念后他(她)最大化自己的报酬。事实上,这种决策
者自己头脑中的推理过程可以假想地分解为两个步骤.这两步运用两种形式截然不同的理性 “认知”理性保持决策者可得到的各种信息和他们的信念之问的一致性.这一概念是指参与者对一个相关环境形成信念的能力(他们对于博弈情势的把握)。与此相对应.“仪器”理性保持给定的机遇和固定的偏好之间的一致性.这个概念是指决策者从既定的信念中推导出他们的策略的能力 因此.认知和推理的一致性和在给定的的外部环境下最大化自己的偏好是假设理性人预设的理性也可这样简单地假设:理性人具有这样的信念,即对他能得到的信息作出精确反映的能力 ,值得强调的是.理性人在考虑自己的福利时也同样考虑周围人的福利。因为在博弈论里.个人效用函数不仅依赖于他自己的选择.而且依赖于他人的选择:个人的最优选择是其他人选择的函数 如果仅仅追求私利而不考虑周围人的福利.这就不是理性.而是“理性傻子”。辅集体理性中的集体是与个体理性中的个体相对应,比如在“囚徒困境”的博弈模型中.参与博弈的某个囚徒是个体.两个囚徒就形成了一个集体。当然,需要注意的是,“个体理性”与“集体理性”均具相对意义.即“个体理性”中的“个体”不仅指自然人.也指大集团中的小团体.而“集体理性”中的“集体”在相对于更大的集团时.贝 0 转化为个人。集体理性是一个以群体利益为出发点的追求效用的行为,它追求的目标是高效率、内部稳定和成员问的公平。集体理性的基本诉求是效率 、稳定和公平。个体的参与与合作是集体的前提,集体要争取个体的参与与合作需要最大化满足个体的偏好。然而可供利用的资源是匮乏的.集体对于个体效用的满足总是要作出有系统的努力.这种系统的努力包括效用的生产和效用的配置.效率是这种努力水平的标志 通过生产和配置努力提高人们活动
的效率.即以尽可能小的代价获得尽可能多的效用.是集体理性的基本行为。集体的稳定是集体存在的关键.协调好集体内部成员之间的利益关系是保证集体稳定的核心条件.所以公平尤显重要 只有公正公平地对待集体中的每一个个体.个体才会参与和合作。只有个体和个体参与到博弈的过程中.个体才被称为集体中的个体,集体才被称为集体。因此.对于一个集体而言,追求效率、稳定和公平是最大的理性。(二)二者矛盾的根源 现实中的个体理性与集体理性总是存在着矛盾:个体理性必须以集体理性为基础,但集体理性的获得或保障却可能是以个体的非理性为代价,集体理性必须以个体理性为前提,但个体的理性行为却未必能保证集体的理性状态。由于个人所掌握的信息不完全,个体理性总是有限的,从而导致决策时往往忽视一些长远的,公共的利益。著名的“囚徒困境”、“公用悲剧”、逆向选择理论、不可能定理等都是个体理性与集体理性相背离的重要佐证。其实,个体理性与集体理性矛盾的基本根源在于个体利益之间的冲突,集体利益和集体理性不过是个体利益对立与冲突的建制化,组织化的表达。 个体利益的冲突来源于资源的稀缺, 稀缺的问题不能彻底解决, 利益的冲突也就不能消除。在现代社会中,利益冲突比较文明的体现是市场竞争。竞争本身也存在合作性竞争和非合作性竞争两种。合作性竞争可能导向集体理性,非合作性的竞争则必然导向集体的非理性。四、个人理性与集体理性存在的矛盾及解决方式囚徒困境是建立在三大基础假设之上的:一是信息不对称博弈双方对自己敌人的选择一无所知;二是竞争中的非合作性,在单次博弈中,竞争者之间不存在合作关系,因此博弈双方为了争取自己利
益的最大化,会发展成恶性竞争;三是陌生人背景,即博弈双方不熟识,不会在日后的长期发展中建立各种人际关系,不存在长期的合作和博弈。因此,被自己最大化的利益所驱使,集体理性和个人理性会发生悖离,产生矛盾。奥尔森在 1965 年提出的“集体行动的逻辑”中描述了这点,当集体人数较少时,集体行动比较容易产生,然而,随着集体人数的增大,产生集体行动就会越来越困难。因为在人数众多的大集体内 ,要通过协商解决如何分担集体行动的成本很不容易。而且人数越多,人均收益就相应减少,搭便车的动机变越强烈,搭便车的行为也越难被发现。一个理性人只要不被排斥在分享由他人努力所带来的利益之外,就没有动力为共同的利益做贡献,而大多人只会选择做一个搭便车者。奥尔森“集体行动的逻辑”与一些社会学家所假设的“一个具有共同利益的群体,一定会为实现这个共同利益采取集体行动”这一必然推导结果产生了不一致。因为个人利益相加并不等于集体利益,每个人使得自己利益最大化不代表集体利益就实现了最大化。因为个人利益不会总是与集体利益保持一致。无论是囚徒困境还是集体行动的逻辑都反映出:个人理性未必是集体理性的充分必要条件;个人的理性行动最终导致的未必是集体的理性的结果。个人理性和集体理性的冲突似乎是人类社会面临的根本性问题之一,也是在人们在社会管理过程难以跨越的障碍。但是也并不是毫无办法。首先,要想走出囚徒困境就要以集体理性代替功利计算的个人理性。亚当斯密曾提出“看不见的手原理”,指出有理性的经济人会在自己利益最大化的基础上理性行动,市场会在“看不见的手”的指挥下达到资源的最优配置,但是由于市场机制本身,即市场无法解决公共物品的外部性,也无法解
决有效信息不对称和市场垄断问题,因此市场无法达到资源的最优配置,实现社会的繁荣,因此个人理性的相加并不等于集体理性。其次,要走出囚徒困境务必加强竞争企业的合作,良性竞争,避免恶性竞争。在囚徒困境中我们发现,囚徒只有合作才是他们最佳的选择,只有合作才会使双方都达到帕累托最优,囚徒双方的利益也实现了最大化,所以,合作才是囚徒甚至陷入囚徒困境中的人们唯一的出路。最后,要想走出囚徒困境就要坚持道德人和经济人的统一。企业和经济的博弈理论是建立在利己主义即自己利益最大化的基础之上的,要保证信息对称和合作精神介入竞争过程,还必须从人性上着手,不然,就很难保证囚徒最终不滑向自利主义的泥潭。亚当斯密在其著作《道德情操论》中指出道德利他,道德人蕴含的仁爱因素对于重构囚徒困境中的人性起着至关重要的作用。道德人要克服狭隘经济人的自利观,坚持道德人和经济人的统一,由原来竞争中的不是我赢就是你输的对抗排斥性的思维方式变为我赢你也赢的合作式思维方式。这种利他主义的引入,不仅会走出囚徒困境最初设立的人性底线,也会在现实层面带来巨大的社会效益。五、如何实现从个体理性走向集体理性(一)非合作性博弈问题的解决就是寻求合作之路博弈可以划分为合作性博弈和非合作性博弈。他们之间的区别主要在于人们的行为相互作用时,当事人能否达成一个有约束力的协议。如果有,就是合作博弈,反之,就是非合作博弈。合作博弈强调的是集体理性,是效率、公正、公平;非合作博弈强调的是个体理性,其结果可能是有效率的,也可能是无效率的。“囚徒困境”是非合作博弈的一个典型模型,“公地悲剧”同样也是个体理性导致
的结果。一块公共的牧地本来可放 50 只羊,超过了这个放牧量就会导致这块公共牧地严重退化,最后的结果将导致这个牧场最后放不了羊。假设这块公地有 10 户人家,每户人的放羊是 5 头,但是每户选择的最优策略是放尽可能多的羊,因为他可以获取通过饲养牲畜所产生的直接受益,但是仅承担一部分来自过度放牧的成本。(二)个体理性选择的结果将导致牧场严重退化,最终放不了羊。 非合作博弈有着一些基本假设,比如资源稀缺、经济人、共同知识和互相不信任等。资源的稀缺是人类生活的事实,自然界并不能主动满足我们的需要。经济人的理性行为仅仅考虑自己利益的最大化,然而由于资源是稀缺的,满足不了每个经济人的这种利益,结果是个体理性与集体理性之间产生各种利益冲突,当个体之间没有达成共识,互相之间不信任时,必然导致非合作性博弈,这是个体理性导致的集体非理性,个体的最大自然偏好也满足不了。在社会经济活动中,非合作博弈所产生的集体理性缺失往往造成效率低下。与非合作博弈相反的是合作博弈,亦称正和博弈,是指博弈各方的利益都有所增加,或者至少是一方的利益不受损害,而其他方的利益有所增加,因而整个社会的利益有所增加。合作博弈强调的是集体主义和集体理性,是效率、公平和公正。如何克服不信任显然是个体理性走向集体理性的通路。关于非合作博弈的研究表面上是描述非合作的规律,更深的目标其实是寻找合作之路。事实表明,只有合作才有最佳的共同结果。 “个体理性”与“集体理性”均具相对意义,即“个体理性”中的“个体”不仅指自然人,也指大集团中的小团体,而“集体理性”中的“集体”在相对于更大的集团时,则转化为个人。从帕累托改进的意义上说,当集体成员的数量严格小于全体社会成员的数量时,个体理性与集体理性的冲突对整
个社会来说就是一件“好事”,尽管它对该集体的成员而言是一件坏事。在囚徒困境中,尽管二人都坦白使囚徒集体的福利减小,但是对整个社会而言这是有益的。同理,令商家痛苦的价格战却使广大消费者从中受益。六、结语本文认为个体理性就是个体人在给定的约束条件下,最大化自己的偏好,而集体理性追求的基本价值是效率、稳定、公正公平,个体理性与集体理性往往是相互矛盾的。从“公共品供给不足”和“公地悲剧”两个典型例子中,我们可以看到,个体理性与集体理性之间存在矛盾,其根源在于再资源稀缺的背景下,个体没有约束的最大化自己的偏好,个体维护自己的利益而互相不信任,结果导致行为决策的不合作。这就需要在组织的框架下个体之间形成一套有效率的公正公平的制度,完成从个体理性到集体理性的通路。参考文献:〔1〕张维迎.《博弈论与信息经济学》.上海人民出版社.2010.11.第一版〔2〕刘庆财.《日常生活中的博弈策略》中国华侨出版社.2012.09〔3〕王小锡.《经济道德观视阈中的“囚徒困境”博弈论批判》.江苏社会科学.2009 第一期.〔4〕肯·宾默尔.王小卫,钱勇译.博弈论与社会契约— — 公平博弈,2010.