返回首页
当前位置: 主页 > 政治法律博弈 >

什么是囚徒困境

时间:2017-07-24 23:19来源:网络整理 作者:采集侠 点击:

  

问题:什么是囚徒困境?是什么意思?

经典的囚徒困境

1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

* 若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

* 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

* 若二人都互相检举(互相“背叛”),则二人同样判监2年。

用表格概述如下:

解说

如同博弈的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:

* 若对方沉默、背叛会让我获释,所以会选择背叛。

* 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。

固定局数的囚徒困境

试想像囚徒困境的情况进行十次。

我们可以合理地设想,如果囚徒第一次被对方指控,第二次这个囚徒也会指控对方。相反,如果第一次别人保持沉默,建立了互信的关系,你也会保持沉默,达致帕累托最优。

当然,两个囚徒都会有相似的想法,在第一局保持沉默,以期望建立互信关系,所以双方都会保持沉默。第二局时,双方亦应有相似的想法,继续保持沉默,以期继续在互信的情况下进行第三局,以致余下的八局。 这种想法合理吗

问题:什么是囚徒困境?是什么意思?

在第十局时,互信的关系明显是没有意义的,因为十局已经完结,囚徒没有必要为维持互信的关系而沉默(没有第十一局),所以第十局囚徒一定会背叛对方的,理由和只有一局囚徒困境一样。

问题是,既然大家都知道在第十局,无论如何对方都会背叛自己的,你在第九局保持沉默也是没有意思的,要知道,保持沉默(友好关系)的原因是为了希望下一局别人保持沉默。所以第九局双方都一定会背叛对方的。

下一个问题是,双方都有相同的想法,明知第九局对方会背叛自己,所以第八局保持沉默也是没有意思的,第七局亦然,如此类推,纳什均衡是十局都会互相背叛,建立互信关系是没有可能的。

只有在囚徒困境的局数大家都不肯定的情况下,上述的推论才不会发生,才会出现互相保持沉默的现象。

一般形式

整理囚徒困境的基本博弈结构,可更清楚地分析囚徒困境。实验经济学常用这种博弈的一般形式分析各种论题。以下是实现一般形式的其中一例:

有两个参与者和一个庄家。参与者每人有一式两张卡片,各印有“合作”和“背叛”。参与者各把一张卡片文字面朝下,放在庄家面前。文字面朝下排除了参与者知道对方选择的可能性1。然后,庄家翻开两个参与者卡片,根据以下规则支付利益:

* 一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。

* 二人都合作:各得3分(合作报酬)。

* 二人都背叛:各得1分(背叛惩罚)。

用支付矩阵表格展示支付如下(以红和蓝分别表示二参与者):

简单博弈获得的点数可以得出一些一般化的结论。

T、R、P、S符号表

若以T(Temptation)=背叛诱惑,R(Reward)=合作报酬,P(Punishment)=背叛惩罚,S(Suckers)=受骗支付,以个人选择得分而言,可得出以下不等式。

T>R>P>S

(解:从5>3>1>0获得以上不等式)

若以整体获分而言,将得出以下不等式。

2R>T S或2R>2P

(解:2×3>5 0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及单独背叛的共得5分,显然合作获分比背叛高。合作在团体而言是支配性策略。)

而重复博

问题:什么是囚徒困境?是什么意思?
弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T S。就是说将使参与者脱离困境。 以上理论是道格拉斯·霍夫施塔特创建的。

现实的例子

上述例子可能显得不甚自然,但现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子,将结果划成同样的支付矩阵。社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都可以用囚徒困境分析,模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用,说明这种博弈的重要性。以下为各界例子:

政治学例子:军备竞赛

在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成都有损坏等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。[什么是囚徒困境]






秦先生 『上海买保险』上海:高端医疗 全球医疗 国际医疗保险经纪人 上海外籍人士买保险-高端人士医疗办理
服务项目:国际医疗保险/免现金结算/儿童疫苗/高端国际寿险/高端重疾险
免费热线『上海』:13761630213, QQ:107242375, Email:13761630213@163.com
选择保险事业 为了爱,为了一份坚定的承诺!微信: 咨询站
上海地区请直接拨打本人电话,应约免费上门提供免费保险方案。
Bupa保柏,   Cigna信诺,   MSH法国万欣和,   GBG全球利益集团,   AXA金盛,   Winterthur丰泰 
友情链接: 走在上海人寿保险的前端    医疗保险情报网   Shanghai Insurance    秦先生的个人简历


------分隔线----------------------------
☆ 高端医疗保险超市 微博更新 ☆
上海保险规划师信息
上海保险规划师信息
外籍人士高端医疗方案推荐
保柏 金盛全球
美国安泰atena 招商信诺
seven corners
安联全球医疗 中国人寿
美国国际医疗集团 MSH china
MSH china
美国安泰atena MSH china
美国安泰atena MSH china
免费咨询国际医疗保险
上海买保险
通过网络取得初步咨询
微信备注“保险咨询”
微信咨询
微信咨询
China Expats Medical insurance
上海买保险,高端医疗保险,bupa儿童疫苗,友邦保险,肺炎疫苗,进口疫苗,儿童保险,儿童医疗,医疗保险,中国人寿保险,保险公司,中国平安保险,医疗险,国际医疗保险,自费药,外籍人士医疗,泰康人寿,英国保诚集团,上海综合保险,国际医疗保险,上海社会保险,上海养老保险,北京高端医疗,招商信诺高端医疗,上海太平洋保险,和睦家医院,上海综合保险卡,买保险,高端医疗,重大疾病,意外伤害,定期寿险,家庭理财,友邦保险,美华妇儿,和睦家保险