囚徒困境现实中的例子”怎样简单易懂地理解,如何应用在现实的

&囚徒困境的现实例子-学网-提供健康,养生,留学,移民,创业,汽车等信息
&囚徒困境的现实例子
囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。自行车赛例子自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研...最后两败俱伤。 军事方面的实际例子:台湾要买美国的F16,中国希望欧洲对华军售,两个地区的政府都在为武器画着大价钱从而损失了国家的经济发展力,这也是囚徒困境的模...Flood)和梅尔文?德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特?塔克(Albert Tucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮...都不符合囚徒困境的特征),但此博弈有唯一的纳什均衡:(坐下,坐下)。 b. 此时的博弈模型如下表(α&0): 可以看出,当α&1时,这个博弈是囚徒困境博弈。同时,不管α是...,此谓之囚徒困境 纳什均衡不懂,只知道有个纳什均衡点,指的是博弈中的平衡点(或稳定点,记不清了,反正就是最有可能出现的点,如上例中的(10,10)点) 例子很简单,比如广告... 按照囚徒困境的分析结论,恋人最得意的选择是另觅新欢,最天真的选择是天荒地老,最理性的选择是分道扬镳,最糟糕的选择是被另有新欢的对方无情抛弃。但是,反关现实中的恋... 价格竞争。 两个企业打价格战,双方都不降价的话双赢,一方降一方不降则一盈一亏,但最终的博弈结果一定是双方都降价,导致双方亏损。 其实"囚徒困境"不允许囚犯A和B进行沟通的假设,与实际生活中大部分情况的现实是有... 只要市场机制公正,自然会增进社会福利。 但是囚徒困境的结果,恰恰表明个人理性不能...,此谓之囚徒困境 纳什均衡不懂,只知道有个纳什均衡点,指的是博弈中的平衡点(或稳定点,记不清了,反正就是最有可能出现的点,如上例中的(10,10)点) 例子很简单,比如广告效应...拿最热的话题房价说事情。开放商面临的就是囚徒困境,他们都不降价,就能逼迫老百姓就范。这只是这个问题的一面,里面还有很多其他的博弈。
您可能还关注:&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
大类导航: |《囚徒困境的现实例子》_精选优秀范文十篇
囚徒困境的现实例子
囚徒困境的现实例子
范文一:现实中的囚徒困境现实案例-优势策略均衡-免费搭车(博弈策略)1、家电价格战:由于彩电行业是寡头控制的,9大厂商控制了70%的市场份额,这样的博弈互动特征更为突出。1999年4月,长虹为扩大市场宣布彩电产品降价,各整个行业市场造成巨大震动,随即康佳、TCL、创维达成默契:建立彩电联盟。直到4月20日上午,康佳仍然表示不降价,但是当晚即改变主意,使得TCL和创维措手不及,价格战立即蔓延开来。大家都降价对于各自的扩大市场没有多大帮助,反而使得利润都被削弱了,年,彩电行业发生大的价格战达到8次以上,整个行业的利润被极大削减,全行业进入亏损,信息产业部统计价格战使行业利润减少147亿元。价格战于人于己都不利,为什么还打价格战呢?这是一个简单的囚徒困境博弈形势。双方作好的结果都是降价,降价都是“优势策略”。大家可能会想到成立价格联盟,但是事实是:日,TCL、海信、创维、厦华、乐华、金星、熊猫、西湘9家厂商歃血结盟,召开了彩电联盟峰会,实际上是一纸空文,当年8月康佳响应长虹的降价20%口号,率先脱离9家同盟会,价格战在次开打。所以,任何同盟都敌不过“先下手为强”的背义利益来的真实。2、军备竞赛:冷战时期的美苏军备竞赛都是各自的优势策略,双方都无法信任对方不搞军事发展,都担心自己被设计而陷入危险,所以即使曾经出现了“盟约”,最后还是不得不撕毁。3、公共资源的过度使用:哈丁(Hardin)于1968年在《科学》杂志上发表的论文《公共地悲剧》经常被引用,表达了这样一个思想:如果人们都只关注个人福利,公共资源就会被过度使用。例如:《公共草地牧羊》一片公共草地可以养羊,但是随着羊的数量增加,草地对羊的贡献价值再下降,假设养2只羊,每只可以带来100元的价值,养3只羊,则每只可以得到60元的价值,到了养4只以后,每只的价值只有40元。如果共有2个养殖户,可以各自选择养1只还是2只时,盈利表显示各自的优势策略是养2只,共4只,所以草地作为公共资源只能产生4x40=160远的价值,远低于2x100=200的贡献,这就是公共资源过度利用,而最后各人利益也被消减了。也说明了对公共财产界定私有产权的重要性。4、公共品短缺:免费搭车当每个人都在希望免费搭车时,公共用品永远是短缺的。如果是家里的灯泡坏了,很快就会买新的换上。如果是公共走廊过道上的灯坏了,很长时间没人理,大家都在忍受黑暗的痛苦,但是都愿意自己花钱换新的,各自的优势策略都是等别人花钱而自己搭车。大家都这么想时,实际上谁也搭不上车了。也就陷入囚徒困境。5、应试教育:几乎所有的教育学家都明白我们的教育过于侧重应试教育,这样对国家的人才培养是极其不利的,但是现实是应试教育愈演愈烈,素质教育可以被学校选择,但是没有多大的生存空间。原因在于,在优势策略均衡中,假定别人搞素质教育,而自己搞应试教育,那么自己在升学率上就会领先,这样的附加利益是巨大的。假定别人搞应试教育,而自己就更要做应试教育已不至于被别人甩开。6、团队生产:在团队中,别人干活而自己偷懒是很难被体现在团队成绩中的,而自己努力别人偷懒的话,那么自己的付出远远大于得到的,而别人不劳而获。这样就形成了“大锅饭”的困境,最后还是集体利益得到损失。原文地址:现实中的囚徒困境现实案例-优势策略均衡-免费搭车(博弈策略)1、家电价格战:由于彩电行业是寡头控制的,9大厂商控制了70%的市场份额,这样的博弈互动特征更为突出。1999年4月,长虹为扩大市场宣布彩电产品降价,各整个行业市场造成巨大震动,随即康佳、TCL、创维达成默契:建立彩电联盟。直到4月20日上午,康佳仍然表示不降价,但是当晚即改变主意,使得TCL和创维措手不及,价格战立即蔓延开来。大家都降价对于各自的扩大市场没有多大帮助,反而使得利润都被削弱了,年,彩电行业发生大的价格战达到8次以上,整个行业的利润被极大削减,全行业进入亏损,信息产业部统计价格战使行业利润减少147亿元。价格战于人于己都不利,为什么还打价格战呢?这是一个简单的囚徒困境博弈形势。双方作好的结果都是降价,降价都是“优势策略”。大家可能会想到成立价格联盟,但是事实是:日,TCL、海信、创维、厦华、乐华、金星、熊猫、西湘9家厂商歃血结盟,召开了彩电联盟峰会,实际上是一纸空文,当年8月康佳响应长虹的降价20%口号,率先脱离9家同盟会,价格战在次开打。所以,任何同盟都敌不过“先下手为强”的背义利益来的真实。2、军备竞赛:冷战时期的美苏军备竞赛都是各自的优势策略,双方都无法信任对方不搞军事发展,都担心自己被设计而陷入危险,所以即使曾经出现了“盟约”,最后还是不得不撕毁。3、公共资源的过度使用:哈丁(Hardin)于1968年在《科学》杂志上发表的论文《公共地悲剧》经常被引用,表达了这样一个思想:如果人们都只关注个人福利,公共资源就会被过度使用。例如:《公共草地牧羊》一片公共草地可以养羊,但是随着羊的数量增加,草地对羊的贡献价值再下降,假设养2只羊,每只可以带来100元的价值,养3只羊,则每只可以得到60元的价值,到了养4只以后,每只的价值只有40元。如果共有2个养殖户,可以各自选择养1只还是2只时,盈利表显示各自的优势策略是养2只,共4只,所以草地作为公共资源只能产生4x40=160远的价值,远低于2x100=200的贡献,这就是公共资源过度利用,而最后各人利益也被消减了。也说明了对公共财产界定私有产权的重要性。4、公共品短缺:免费搭车当每个人都在希望免费搭车时,公共用品永远是短缺的。如果是家里的灯泡坏了,很快就会买新的换上。如果是公共走廊过道上的灯坏了,很长时间没人理,大家都在忍受黑暗的痛苦,但是都愿意自己花钱换新的,各自的优势策略都是等别人花钱而自己搭车。大家都这么想时,实际上谁也搭不上车了。也就陷入囚徒困境。5、应试教育:几乎所有的教育学家都明白我们的教育过于侧重应试教育,这样对国家的人才培养是极其不利的,但是现实是应试教育愈演愈烈,素质教育可以被学校选择,但是没有多大的生存空间。原因在于,在优势策略均衡中,假定别人搞素质教育,而自己搞应试教育,那么自己在升学率上就会领先,这样的附加利益是巨大的。假定别人搞应试教育,而自己就更要做应试教育已不至于被别人甩开。6、团队生产:在团队中,别人干活而自己偷懒是很难被体现在团队成绩中的,而自己努力别人偷懒的话,那么自己的付出远远大于得到的,而别人不劳而获。这样就形成了“大锅饭”的困境,最后还是集体利益得到损失。
范文二:囚徒困境的生活实例分析中南财经政法大学 工商管理学院博弈论对人的基本假定是:人是理性的,理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。“囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。问题可以总结为:在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。 囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个有人有积极性遵守这个协定。从自私自利的角度出发,选择认罪是最好的这种说法是有缺陷的,因为两个人都可能会得到8年的监禁期。即使是最狡猾的方法也不能把你救出监狱。但是如果你期望你的同伙与你合作,那你最好的选择将是认罪。然而,如果你的同伙知道了你的计划,他也会认罪,此时最好的方法是你们两个合作。这就是这个悖论的关键所在。如果从整体来看,对于两个囚犯而言,最好的结果是两人合作,其它的任何选择都是不好的。实例分析 1:一.电信价格竞争根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争,一开始的价格都是P0。A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚刚成立不久,翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的。正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优惠,其中就有B的价格可以比P0低 10%。这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。在这样的市场分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影响。这时候,A该怎么做?不妨假定:A降价而B维持,则A获利15,B损失5,整体获利 10;A维持且B也维持,则A获利5,B获利10,整体获利15;A维持而B降价,则A损失10,B获利15,整体获利5;A降价且B也降价,则A损失5,B损失5,整体损失10。从A角度看,显然降价要比维持好,降价至少可以保证比B好,在概率均等的情况下,A降价的收益为15×50%-5×50%=5,维持的收益为5×50%-10×50%=-2.5,为了自身利益的最大化,A就不可避免地选择了降价。从B角度看,效果也一样,降价同样比维持好,其降价收益为5,维持收益为2.5,它也同样会选择降价。在这轮博弈中,A、 B都将降价作为策略,因此各损失5,整体损失10,整体收益是最差的。这就是此博弈最终所出现的纳什均衡。我们构造的这一电信业价格战博弈模型是典型的囚徒困境现象,各个局部都寻求利益的最大化,而整体利益却不是最优,甚至是最差。许多其他行业的价格竞争都是典型的囚徒困境现象,如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。实例2二.OPEC组织成员国之间的合作与背叛“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。上述我们在对电信价格竞争的博弈分析中,只是一次性的“囚徒困境”博弈,因此得到了互相降价的纳什均衡。而在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。比如中东石油输出国组织(简称OPEC)的成立,本身就是要限制各石油生产国的产量,以保持石油价格,以便获取利润,是合作的产物。OPEC之所以能够成立,各组织成员国之间之所以能够合作,是因为囚徒困境如果是一次性博弈的话,基于个人利益最大化,得到纳什均衡解,但如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上着名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过“可信的承诺”,向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉。这里“可信的承诺”是一个很牵强的翻译,“Crediblecommitment”并不是什么空口诺言,而是实实在在的付出。所以合作是非常困难的。 所以OPEC组织经常会有成员国不遵守组织的协定,私自增加石油产量。每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失。当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降–结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌。理论上,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。那么是不是不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。但只要是有限次的合作,合作就不会成功。比如合作10次,那么在第九次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。但是大家料到第九次会出现不合作,那么就很可能在第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作……一直到,从第一次开始大家都不会采取合作态度。以上是运用博弈论中的经典案例“囚徒困境”对现实经济生活的一些简单的理论上的分析,虽然在现实生活当中影响人们决策和态度的因素很多,但是,博弈论作为现代经济学的前沿领域,始终是一个强有力的分析工具,运用好博弈论,我们的生活将更有智慧。
范文三:囚徒困境解说解说如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
范文四:关于考研学习中的囚徒困境囚徒困境是我们生活中常见的一种博弈模型,我在我们的生活中也发现了一个囚徒困境模型。 我国每年会在12月底举行一次研究生入学考试,每年报名人数大约在160W左右,而每年各个大学及研究所共招收约50W左右。全国大学生每年考研学习准备时间约从大三下开始,直到考研12月底考试结束,准备时间约一年左右。每一个人如何才能付出最少而能考取研究生呢?我的例子根据以下假设而来:①假设每年报考人数不变②每年各大学和研究所总招生人数不变(不论学生学业水平如何,都必须从总报名人数中招收50W)我们可以将以上问题简化为一个简单模型,将总报名人数160W视作两个人,而将录取人数看做一个人。前面的问题就可以简化为以下问题机构从两个人中选择一个优秀的人,而这两个人都想成功入选,但又都想付出最少。这两个人都有两种选择,要么努力(每天学习10小时),要么不努力(每天学习5小时),如果一个努力,一个不努力,那么机构将选择努力的那个人,如果两个人都努力,机构也只会随机从中选取一个,如果两个人都不努力,那么机构也会随机从中选取一个。这两个人不能沟通,都想自己被选中,但又都不想努力。备注:努力与不努力是相对的假设这两个人分别为A,B,努力得3分,不努力得1分,结果如下:理论上最好的方式是两个人都不努力,付出最少,然后让机构随机选出一个,最糟糕的方式是两人都努力,然后机构还是只从中选出一个,但由于两人不能沟通,都担心自己不努力而对方努力,那么机构选择努力的人,自己将会落选,于是两人都会努力。还原回最初的问题,这150W考生由于不能沟通,都担心别人努力而自己不努力,于是都会努力学习,延长学习时间,付出最多,陷入困境。解决方式:理论上,只要有一个强大的组织将这150W人组织起来,安排大家每天都只学习一定时间,那么久摆脱了此困境。但实际上,由于此困境过于强大,参与人数过多,且人与人之间相互的不信任,也缺乏一个强大的组织将这150W人组织起来,(就算能组织起来估计也算违法行为),此困境实际上基本不可能解决。
范文五:囚徒困境解说例子1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。用表格概述如下:解说如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
范文六:简析博弈论中的囚徒困境 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。经典的囚徒困境警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:? 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。? 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ? 若二人都互相检举(互相“背叛”),则二人同样判监2年。用表格概述如下:如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势策略”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子,将结果划成同样的支付矩阵。 社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都可以用囚徒困境分析,模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用,说明这种博弈的重要性。以下为各界例子:政治学例子:军备竞赛两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的「理性」行为,但结果却显得「非理性」(例如会对经济造成都有损坏等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。经济学例子:关税战两个国家,在关税上可以有以两个选择:提高关税,以保护自己的商品。(背叛)与对方达成关税协定,降低关税以利各自商品流通。(合作)当一国因某些因素不遵守关税协定,而独自提高关税(背叛)时,另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。)商业例子:广告战商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。此二公司可以有二选择:互相达成协议,减少广告的开支。(合作)增加广告开支,设法提升广告的质量,压倒对方。(背叛)若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 自行车赛例子自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自由车赛中有以下情况:选手们在到终点前的路程常以大队伍(英文:Peloton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会赶上(共同背叛)。而通常的情况是,在最前面次数最多的选手(合作)到最后通常会被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。总论并不是每次个人的“理性选择”都能让自我利益最大化,也许会让你陷入一个“囚徒困境”。大量例子说明,在“囚徒困境”中,常常是先动手的一方会占一些优势。那么,“先下手为强”吧。简析博弈论中的囚徒困境 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。经典的囚徒困境警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:? 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。? 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ? 若二人都互相检举(互相“背叛”),则二人同样判监2年。用表格概述如下:如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势策略”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子,将结果划成同样的支付矩阵。 社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都可以用囚徒困境分析,模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用,说明这种博弈的重要性。以下为各界例子:政治学例子:军备竞赛两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的「理性」行为,但结果却显得「非理性」(例如会对经济造成都有损坏等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。经济学例子:关税战两个国家,在关税上可以有以两个选择:提高关税,以保护自己的商品。(背叛)与对方达成关税协定,降低关税以利各自商品流通。(合作)当一国因某些因素不遵守关税协定,而独自提高关税(背叛)时,另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。)商业例子:广告战商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。此二公司可以有二选择:互相达成协议,减少广告的开支。(合作)增加广告开支,设法提升广告的质量,压倒对方。(背叛)若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 自行车赛例子自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自由车赛中有以下情况:选手们在到终点前的路程常以大队伍(英文:Peloton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会赶上(共同背叛)。而通常的情况是,在最前面次数最多的选手(合作)到最后通常会被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。总论并不是每次个人的“理性选择”都能让自我利益最大化,也许会让你陷入一个“囚徒困境”。大量例子说明,在“囚徒困境”中,常常是先动手的一方会占一些优势。那么,“先下手为强”吧。
范文七:浅谈博弈论之“囚徒困境”夏陈程
申继玲 黄宇雯蒋洁
陈安艳(江苏第二师范学院生命科学与化学化工学院,江苏南京210013)摘要:博弈论主要研究公式化了的激励结构间的相互作用。博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。“囚徒困境”是博弈论的静态博弈中最具代表性的例子,反映了个人最佳选择并非团体最佳选择。虽然囚徒困境本身只属模型性质,但现实中也会频繁出现。关键词:囚徒困境;博弈论;纳什均衡;帕累托最优博弈论又被称为对策论(Game Theory),既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论是指二人在平等的对局中各自利用对方的策略进而变换自己的对抗策略,最终达到取胜的目的。博弈论思想古已有之,中国古代的军事著作如《孙子兵法》,也是一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,当时的人们对博弈局势的把握只停留在经验上,没有向理论化发展。直到年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。博弈论的类型有:合作博弈、非合作博弈、完全信息/不完全信息博弈、静态博弈和动态博弈。合作博弈研究人们达成合作时如何分配合作得到的收益,即收益分配问题;非合作博弈研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题;完全信息博弈是指参与者对所有参与者的策略空间及策略组合下的支付有充分了解,反之,则称为不完全信息博弈;静态博弈是指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略;动态博弈使指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。囚徒困境是博弈论中的静态博弈的最具代表性的例子。囚徒困境(prisoner'sdilemma )是指两个被捕的囚徒之间的一种特殊博弈,说明甚至在合作对双方都有利时,为什么保持合作也是困难的。它的核心理念是博弈全输,合作双赢。1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,知道两人有罪,但缺乏足够的证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年;若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年;若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。用表格概述如下:如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益,这也就是经典经济学中的“理性人假设”。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。在没有任何其他力量干预个人决策的情况下,参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够相信对方不会反口。就个人的理性选择而言,背叛对方所得的刑期,总比沉默要来得低。可以推测困境中两名理性囚徒的心理活动:一方面,对方沉默时,背叛会让我获释,所以会选择背叛;另一方面,若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡(纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。假设有n个局中人参与博弈,如果某情况下为了自身利益的最大化,没有任何单独的一方愿意改变其策略,则此策略组合被称为纳什均衡。纳什均衡,从实质上说,是一种非合作博弈状态),就是双方参与者都背叛对方,结果二人同样服刑8年。这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优(也称为帕累托效率(Pareto efficiency),是指资源分配的一种理想状态,假定固有的一群人和可分配的资源,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,使得至少一个人变得更好)解决方案。从全体利益方面考虑,如果两个参与者都保持沉默,两人都只会被判刑1年,总体利益更高,比两人背叛对方、判刑8年的情况好得多。但根据以上假设,二人均为理性的个人,且只追求个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作时高,总体利益较合作时低。这就是“困境”所在!该例子漂亮地证明了:静态博弈中,帕累托最优和纳什均衡是相冲突的。人类的个人理性有时能导致集体的非理性,也就是说,聪明的人类会因自己的聪明而作茧自缚。囚徒困境就像是一把尖锐的刀,生硬地将人性的自私自利剖出并展现在众人眼前,难道囚徒困境就没有解决的办法?难道在帕累托最优和纳什均衡是相冲突时,不能有人性美好的闪光点?当人除了单纯的理性外,还有人与人之间的信任及自我的牺牲精神,那么,“囚徒困境”就能不攻自破,有了对对方的信任以及自己牺牲的大无畏精神,这道选择题恐怕就没有这么难了。也许上述的说法太感性,但是我们仍旧可以用较学术的角度来探究解决囚徒困境的方法,那就是——背叛的恐惧可以被合作产生的信任冲淡!先前的博弈建立了的信任,产生了合作的经验,由此可以削弱群体中背叛的可能性,解决囚徒困境的方法也就因此浮出水面。我们在成长过程中,常常会遇到与“囚徒困境”相似的境况,年轻人在多次的合作或背叛后,就能积累经验,获得了对背叛可能性的更真实的印象,变得更成功地参与博弈,这就是为什么成长经验在人的一生中这么的重要,它甚至决定了我们以后的生存方式。
范文八:[摘要]在博弈论中,囚徒困境问题是一个极为重要的范例,对其的研究及探讨,不仅涉及到了经济学,还延伸到了社会学以及生物学等领域。在实际生活中,囚徒困境得到了十分广泛的应用。文章针对囚徒困境提出了几点基本性的假设,并进一步对生活中的博弈现象进行了探讨。   [关键词]重复囚徒困境模型;现实环境;博弈理论   中图分类号:O22 文献标识码:A 文章编号:(-01   重复囚徒困境的要求是参与者对囚徒困境的反复博弈,且能对对抗的历史进行记忆。提出“重复囚徒困境”的作者通过两次组织比赛,获知,以牙还牙策略虽简单但十分有效。在实际生活中,重复囚徒困境是一种较为广泛性的现象,“以牙还牙”也具有一定的现实意义,基于此,笔者提出了如下3种假设。   第一,参与者对囚徒困境的反复博弈,且能对对抗历史进行记忆。   第二,参与双方并不清楚博弈的总回合数。   第三,参与双方均认为自己的背叛会在接下来的回合中遭到报复。   然而,因为现实环境中的现象更为广泛,而“以牙还牙”并非适用于所有情况。因此,本文针对实际生活中重复囚徒困境的策略运用,对其范围进行了延伸性探讨。   一、理性人假设不成立现象   在经济学、博弈学中,理性人假设不仅是其中的理论性基础,也是概率问题探讨的必要假设。然而,在实际生活中,理性人现象通常并不存在,正是由于大都非理性人行为具有的不可预测性,才使得现实环境的丰富化和多样化。最典型性的非理性例子体现在股市。索罗斯认为,人们对经济及股市的情绪会对股市产生直接影响,人们对股市持乐观态度时,并促使集聚效应的形成,人们看好股市,股价便会上涨,反之,股价又会不断的对人们的预期产生刺激。而当人们意识到真实情况时,便会纷纷出逃,这时股价的逐渐下跌又会增加人们的恐慌,这样就会使股市出现非理性下跌的情况。这便是索罗斯的泡沫循环理论,但是实际意义产生的影响要大大低于非理性行为所带来的影响。   二、有限性博弈情况   在实际生活中,博弈行为具有有限性,人和人之间进行博弈行为在双方交集性行为这一范围中发展的。虽然,在社交网络的进程中,六度分割理论打下了理论性基础,其认为在网络基础上,人们可以进行广泛性的互动和交流,但是,人际交往中的博弈行为重点考察的是人与人之间的利益性互动行为。这并不能说明,人际交流的途径变得更加广泛,在双方的彼此疏远中必会存在持续的博弈行为。   基于上述情况,投机机会在短时间内会存在:在双方利益出现交集时,互相获取对方的利益,并在分开后,会反过来继续寻求与对方的再一次交好。这也就是说,在双方存在交集性利益时,因为有限的时间和空间,会使得博弈行为也变得十分有限,对于双方而言,与之相关的利益有大有小。在此种现象下,人们有如下两种选择,一是投机,被称为投机者;二是以长远眼光在规定的范围内形事,被称为投资者。投机者会不断从对方身上赚取利益,即便面临着报复的可能,但是只要很好的将损失控制在一定范围内,就依然可以继续投机操作。然而,对投资者来说,短期性的投机行为是不可取的。就投资者而言,他们会以长远的眼光,加强对自身的形象以及信誉的维护。从长远角度出发,投资者这一选择更为理性,但是同时不能否认的是,在有限性的博弈行为中,投资者优势并不明显,且会遇到许多困难,因此,为了获得较多的投资机会,投资者是一个理性的选择。   三、双方的差异性体现   在重复囚徒博弈中,存在一个并不明显的假设,那就是囚徒双方在信息资源的获取及配置上,具有平等性。然而在实际生活中,双方并不平等且具有差异性。人和人之间存在的差异是广泛性存在的,并不属个例。在重复囚徒困境中,隐性假设的发生具有特定性,所以,实际的重复博弈问题中,双方存在的差异性应该被纳入考虑的范围。相较于一方,当另一方具有更明显的信息资源优势时,在博弈行为中,他就可以不顾后果的选择投机行为,或更具优势的一方,完全可以利用信息资源的优势将可能会由报复而引起的损失最小化。而基于这类情况,处于弱势的一方只能选择放弃合作,而寻求更适合的发展方式。以谷歌为例,微软曾在收购谷歌时,提出的价格为20亿,遭到了谷歌的直接拒绝。但是让人意料不到的是,十年后谷歌的市值已达1700亿,并成功成为微软不可忽视的一个强劲对手。   四、结束语   综上所述,根据重复囚徒困境中博弈行为的基础假设,对实际生活中此类假设不能涉及的情况展开了进一步的研究和探讨。需要注意的是,就长期性概率统计的实际意义而言,对重复囚徒困境的基础性假设具有一定的合理性。而针对实际生活中的特例,本文的探讨也具有一定的意义。
范文九:囚徒困境与走出囚徒困境引言:在一堂课中,一个小组讲到了囚徒困境这问题,老师当堂随机提问了两位同学,一位同学的回答是选择背叛检举对方,另一位同学的回答是不检举对方。而我所说的“另一位同学”也就是我,当这个问题出现的时候,我的脑海里先浮现的是不检举对方,对于这个问题,我就在考虑如果我背叛了对方,那么我么两个人的刑期之和将会大大增加,如果我不检举对方,对方也不检举我,那么我们两个人将会之服刑期一年,这样我们两个人也就是一个集体所能够达到的利益才是最大的。但是在博弈论中,按照纳什均衡的理论,我的这个选择说明我不是一个理性的个体,所以我将会在此讨论一下囚徒困境的问题一、囚徒困境囚徒困境是这样一个问题,问题的背景是警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(也就是背叛对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(也就是双方合作),则二人同样判监1年。若二人都互相检举(背叛),则二人同样判监8年。这个困境成立的条件:1.甲乙两人分开囚禁,不能互通信息2.两个人都知道规则与结果3.每个人都是一个理性的个体。所以大部分人在看到这个问题的时候都会有这样的分析:如果对方选择合作,我选择合作,那么我们都会一年刑期,我选择背叛呢,那么我将会被释放。如果对方选择背叛,我也只有选择背叛才会让自己的兴起最短。根据纳什均衡,每个囚徒都是理性的个体(即追求自身利益的最大化,并不关心其他人自身的利益),只会选择利益最大的一个选项(即背叛),这样的一个结果出现的一个基本条件就是两个囚徒并不能够相互串通,所以他们只能相互揣摩对方的心里来选择一个最佳的答案。正是因为两个人面对的情况一样,两个理性的个人作出的选择也都一样,所以囚徒的困境才会出现(即两个人选择的结果都为背叛),也就达到了纳什均衡。这场博弈的纳什均衡,显然是不顾及团体利益的,以全体利益而言,如果两个人都合作保持沉默,两个人只会被判一年,总体利益最高,结果比两个人背叛。判刑八年的结果好得多。但是根据以上假设,二人均为理性的个人。且只追求自己的个人利益,均衡状况就是说两个人都选择背叛,结果两人判决均比合作为高,总体利益比合低,这也就是囚徒2的困境了。正是这种囚徒困境的在大多数情况下损害了集体的利益,所以我们更需要的是走出求囚徒的困境。囚徒的困境的关键点就在于集体理性与个人理性的相互冲突,所以如何从个人理性走到集体理性就是一个很重要的话题了,所以我就从个人理性走到集体理性来分析一下如何走出囚徒困境。个人理性的定义为:为了能够生存,人必须对自己的生存进行谋划、算计和寻找给予本体安全感与价值的源泉。这就是个体理性的基本行为目标,通常将其归纳为三个方面:效用、安全、自由。个人的生存过程就是一种不断追求这些行为目标的过程,因此总会将个人利益最大化作为行动指南,这样的行为即所谓的个体理性。集体理性是一个以群体利益为出发点的追求效用的行为,它追求的目标是高效率、内部稳定和成员间的公平。集体对于个体效用的满足总是要做出有系统的努力,这种系统的努力包括效用的生产和效用的配置,效率是这种努力水平的标志。通过生产和配置努力提高人们活动的效率,即以尽可能小的代价获得尽可能多的效用,是集体理性的基本行为。集体的稳定是集体存在的关键,协调好集体内部成员之间的利益关系是保证集体稳定的核心条件,所以公平尤显重要。正是因为集体的稳定是集体存在的关键,协调好集体内部成员之间的利益关系是保证集体稳定的核心条件,所以从个人理性走到集体理性也就成为了可能,这种可能是在一定的附加条件之上的,最重要的条件就是制定惩罚措施,也就是奖罚分明,另一个条件就是人数要少。一个组织内部,人员越少,效率也越低,这个也是我在大学通识课的小组作业过程中认识到的一点,因为人数少,我们就可以进行相互的监督,这样的haunted每个人的行为就成了在多次博弈中的计算对象,每个人都可以根据别人的行为调整自己的行为决策的同时,别人也可以根据自己的行为调整他们的决行为,同样每个人也会在行动前考虑别人的行为从而决定自己的行为,所以在适当的人数前提下,集体的效率就会提高。但是如果人数众多,那么每个人就做不到根据别人的决定去选择自己的决策,因为人数太多,我们并不能做到考虑很多人的决策,所以这时候就要有一个明确的奖罚制度来进行约束,也就是根据每个人贡献的大小对其进行相应的奖励,如果因为一些人影响了集体的利益,那么将会对这些人进行相应的惩罚,这样每个人都会有一个共识,既在不损害集体的利益的前提下,最求自身利益的最大化,这样既满足的集体了利益,又能追求自身的利益。我们就从个人理性走到了集体理性。对于囚徒的困境也就能够走出来了,在这个囚徒的困境之上再建立一种惩罚制度,每个人不合作(也即是个人理性),见识受到比坐牢10年更大的惩罚,那么每个人都将会选择合作(达到了集体理性),囚徒的困境也就走了出来。结语:因为人的本性就是自私的,这也是世上任何一种动物的本性(人是一种高级动物),所以如果不存在约束,那么每个人都会是一种个人理性从而损害了集体的而理性,所以在当今社会,一定要在保证集体利益的前提下去追求个人利益的最大化,例如我们在法律允许的范围内可以行使自己的权利,追求自己的利益,但是你触犯了法律,也就是损害了集体的利益,那么将会受到法律的惩罚。所以确立明确的奖罚制度能够帮助我们走出“囚徒困境”陈思丹《从个体理性走向集体理性》王苏珂《个体理性引发的集体非理性——解读经济危机》.《东南大学学报(哲学社会科学版)》2009年6月第11卷增刊杜晓堂.《一个个体理性与集体非理性的悖论》.《中国大学生就业》.2003(4) 杜晓堂.《一个个体理性与集体非理性的悖论》.《中国大学生就业》.2003(4)
范文十:论“囚徒困境理论” “囚徒困境”是博弈论里最经典的例子之一。其中对于囚徒困境的描述:话说有一天,一 位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,甲和乙, 并从他们的住处搜出被害人家中丢失的财物。但是,他们都否认曾杀过人,辩称是先发现富 翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行 审讯。由警察分别和每个人单独谈话。警察说,“由于你们的偷盗罪已有确凿的证据,所以 可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你 半年的***,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判 十年刑, 他只判半年的***。 但是, 如果你们两人都坦白交代, 那么, 你们都要被判五年刑。 ” 囚徒甲和乙该怎么办呢?他们作为本博弈中的两个博弈方, 他们都有两个选择——坦白 或抵赖。很显然,最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于 隔离的情况下无法串供。所以,根据个体理性原则,两个博弈方的目标都是要实现自身利益 最大化。 对于囚徒甲来说,囚徒乙有坦白和抵赖的两种可能的选择,如果囚徒乙选的是抵赖,则 对于囚徒甲来说,他应该选择坦白,因为抵赖的得益为-1,坦白的得益为-1/2; ,如果囚徒乙 选的是坦白,则对于囚徒甲来说,他应该选择坦白,因为抵赖的得益-10,坦白的得益为-5。 因此, 在本博弈中, 无论囚徒乙选择何种策略, 囚徒甲选择坦白给自己带来的收益是最大的; 同样的,囚徒乙和囚徒甲的情况一样,因此囚徒乙的选择和囚徒甲一样。因此,该博弈的最 终结果是博弈双方同选择坦白策略,同时获益-5,都判五年刑。 乙囚犯可能采取的策略 坦白 甲囚犯可能采取的策略 坦白 抵赖 -5 -5 -1/2 -10 抵赖 -10 -1/2 -1 -1囚徒的困境 该理论其中的意义在于: 个人理性与集体理性的矛盾, 个体追求的利己行为而导致的最 终结局是一个“纳什均衡”,也是对所有人都不利的结局。这由于两人都是在选择策略时首先 想到自己,因此他们必然要服长的刑期。 针对这种情况,本文从另外的角度来探讨囚徒理论。 再谈这个问题之前,我们首先要对理性人这一概念进行讨论。 西方经济学家指出, 所谓的“理性人”的假设是对在经济社会中从事经济活动的所有人的 基本特征的一个一般性的抽象。 这个被抽象出来的基本特征就是: 每一个从事经济活动的人 都是利己的。 也可以说, 每一个从事经济活动的人所采取的经济行为都是力图以自己的最小 经济代价去获得自己的最大经济利益。西方经济学家认为,在任何经济活动中,只有这样的 人才是“合乎理性的人”,否则,就是非理性的人。 既然如此,“每一个从事经济活动的人所采取的经济行为都是力图以自己的最小经济代 价去获得自己的最大经济利益”中间所说的经济代价和经济利益到底是怎样的经济代价和经 济利益呢?是长期的还是短期的呢?因此, 本文认为, 我们有必要对理性人这一概念做出重 新解释。本文认为,理性人是并非是纯粹的理性人,而是有道德因素,任何人在行为过程中 无法撇开这一因素而展开行动。 解决了这个问题之后,本文将主要从两个方面来看: 第一种情况: 假设甲乙两个囚徒绝顶聪明,考虑问题都比较周到,颇有战略眼观,之如孔明等,也就是说是理性的,根据个人理性的原则,囚徒甲乙根据自身利益最大的原则行事,那么在警察 所提出的条件中, 则会做出与囚徒理论相反的选择。 原因在于囚徒甲乙分别对警察说提出的 条件充分考虑过后,也就是说,对“囚徒理论”做出了分析,得出如果“坦白”将会都获得五年 的徒刑的结论,那么,作为理性人的甲和乙,只有做出“抵赖”的选择才可能获得最小惩罚, 即一年的徒刑,得益最大。 第二种情况: 在现实生活中,人是理性的动物,同样也是有感情的,那么在这种情况下,我们做出如 下推断: 甲乙囚徒两人的关系坚如磐石, 情比金坚, 两人价值观都是先义后利, 以义制利的思想, 在此危难时刻都会作出宁可牺牲自己以成全他人的情操,比如伯夷叔齐等,此时此刻,囚犯 甲乙都以使对方获益最大来作为自身利益最大化的选择。 那么,可做以下分析: 对于囚徒甲而言,囚徒乙有坦白和抵赖两种选择,如果囚徒乙坦白,因为坦白则对方获 益为-5,抵赖则获益为-1/2,尽量使对方获益最大,因此囚徒甲则选择抵赖;如果囚徒乙选 择抵赖,自然囚徒甲选择抵赖同样也是最佳选择,因为对方获益为-1。同样的,因为囚徒乙 和囚徒甲的情况完全相同,所以选择抵赖。其最终结果为两人都是选择抵赖,获得最短时间 的***,即一年。 囚徒甲和乙在这两种情况之下出发点尽管有所不同, 但是其结果都是达到了其利益最大 化,并且在某种程度上也遵循了个体理性原则。 通过以上的分析,我们不难发现,博弈论中囚徒困境理论也有其不合理之处,大家都知 道理论的重要意义在于类似的情况之下给人们社会经济生活带来指导。 在经济发展中, 我们 应该认识到“看不见的手”还有更多内涵,有待我们去发掘。 本文主要通过对该理论的分析,从中发现对企业经营管理活动的有义启示。 第一,在市场竞争过程中,一名优秀的经营者,无论做任何决策还是考虑问题应该有战 略眼观, 特别是在做出对企业乃至行业今后发展的竞争策略时, 从长远出发, 做正确的决断。 第二,保存对手就是保存自己。在市场竞争中,让竞争对手发展就是自己发展,本着求 同存异的思想,共谋发展,避免恶性竞争,避免两败俱伤的情况。 第三,市场竞争不是纯粹的竞争,在义和利之间应该如何取舍,是一位有战略眼观的企 业家该做的第一个选择。

我要回帖

更多关于 囚徒困境原理 的文章

 

随机推荐