返回首页
当前位置: 主页 > 政治法律博弈 >

重复囚徒困境博弈中的社会行为仿真doc下载

时间:2018-02-17 06:28来源:网络整理 作者:采集侠 点击:

  

重复囚徒困境博弈中的社会行为仿真第卷第期模糊系统与数学Vol>,No年月FuzzySystemsandMathematicsOct,文章编号:()重复囚徒因境博弈中的社会行为仿真带张宏伟周宽宽胡能兵(长沙理工大学数学与计算科学学院湖南长沙)摘要z大多数经济行为都可以看作博弈论的一个特殊案例。本文通过计算机仿真对重复囚徒困境博弈的特点进行了分析建立基于累积期望差异评价策略的重复囚徒困境博弈模型并对仿真结采进行了分析。分析结果表明它能够对社会群体行为随着时间的椎移提供动态描述同时对于重复博弈问题的研究有着重要的辅助作用。关键词重复博弈孤独者策略累积期望差异仿真社会中国分类号:文献标识码:A随着计算机的出现和决策支持系统的发展博弈的仿真研究越来越受到重视。根据成员的博弈规则生成仿真模型通过仿真的结果分析可以迅速对问题提供有益的支持气本文根据元胞自动机中的VonNeumann邻居模型从成员的理性行为出发在一个X的仿真社会中建立重复囚徒困境博弈模型。模型中加入孤独者策略以避免共同欺骗的冻结状态飞并引人社会流动机制。最后利用仿真分析并讨论了策略评价的侧重度、惩罚机制及其权重、流动强度等对社会群体行为的影响。重复囚徒困境囚徒困境CPD)是博弈论的一个经典问题凶。在该博弈中有个局中人均有个策略:合作或背叛分别用><#'>C、D表示。然而在现实生活中的很多情况下局中人经常不愿意参加无望或冒险的社会活动<#'>C气而是依靠小的但至少是安全的自身努力。我们引人孤独者策略L飞<#'>C和D参与至tl博弈中去L不参与而仅获得稳定但较少的支付。那么我们可以得出引入自愿性参与策略后的囚徒困境的支付矩阵(如表)。表自愿性参与囚徒困境的支付矩阵<#'>CDL<#'>CODL*牧稿日期:修订日期:><基金项目国家自然科学基金资助项目()湖南省教育厅优秀青年项目(B)作者简介张宏伟)男湖南人教授研究方向g偏微分方程的边值问题及其应用。模糊系统与数学年仿真社会环境模型仿真在社会结构为X大小的种群中进行采用VonNeumann邻居结构<#'>C、D、L三个策略等概率地随机放置在X的格子上采用表所示的支付矩阵。考虑在现实社会环境中的人口流动性本模型在保持社会结构稳定的前提下采用一种简单的低流动性结构流动过程为:对随机选取的m个局中人分别与随机选取的个邻居互换位置。评价策略我们采用的是累积期望差异评价策略气从局中人的个体理性出发且充分考虑到个邻居的策略及支付分析局中人的博弈行为从而给出一种博弈规则。该规则能够较好的反映局中人的实际心理特征。期望水平期望水平定义为:在第阶段博弈中E是局中人i的期望水平到是局中人i的实际支付。期望差异指期望水平与实际支付之差用〈表示。e:=Ep:模型描述建立个N人重复博弈模型。令局中人集合为A={l…N}所有策略的集合={<#'>C,D,L},N(i)为局中人i的所有邻居的集合ti为局中人i的策略则局中人i的有限策略组合Ti={饵tj)ItEOiεAjεN(i)}。阶段支付函数为:p:TR它是策略组合T实现后局中人i得到的阶段支付。假设博弈阶段在时间=…A重复进行。局中人独立选择策略t=叫时…可)tE而后得到各自的支付户i(t)。用h表示博弈的历史集合:h={s时t…t#)Is注olξO~=,,,s}在此模型中局中人将依赖自己的博弈历史、支付和自己邻居的博弈历史(仅限于最近三次)、支付来确定下一阶段的策略。令ε()为局中人i对期望水平的更新系数αξ为局中人对历史最大支付和当前支付的侧重度则局中人i在前阶段的期望水平如下所示:当s=时E(h)=E~(E为初始期望值)。当=时M(h)=αmaXPi(t)一α)丸M=maxh(t勺。E(h)=Tj何EO一kEssE~skEN(ih)可)M)十clTj)(TjE十clTj)M)其中:h={s一(tt…t#I)},kEN(i)且唯一。k在阶段博弈结束后由于是重复博弈局中人可以充分了解各个邻居的策略、支付信息那么局中人完全可以根据实际策略从阶段博弈中获得的支付来判断那一策略为最优阳从而选择下一阶段的策略。下面我们建立策略评价函数。,=EVi=I主ιι当局中人i在阶段不选择tξ其中é是期望差异==E一到tiI~t=~’’ll当局中人i在阶段选择ti局中人在下一阶段的博弈中总是选择评价最好的策略也就是累积期望差异最低的策略飞在这里我们对仿真社会加入流动机制流动过程为:对随机选取的m个局中人分别与随机选取的一个邻居互换位置。第期张宏伟周宽宽等重复囚徒困境博弈中的社会行为仿真仿真结果分析分析指标仿真社会中使用各策略(<#'>C、D、L)局中人的人数。每二次博弈完成后统计使用策略cc、D、L)局中人的人数。以重复博弈的次数为时间序列绘制各阶段使用三种不同策略的人数曲线。仿真社会中使用各策略(<#'>C、D、L)局中人的平均得分(平均收益)。每一次博弈完成后采用表所示的支付矩阵统计每次博弈后每个局中人的得分根据所使用策略的不同计算各策略的平均得分。以重复博弈的次数为时间序列绘制各阶段平均得分曲线(曲线绘制均使用MATLAB完成)。无惩罚机制图:初始期望E~εJE~EZ期望更新系数亨=O侧重度α=<#'>C局中人完全依靠历史最大支付值)重复次数:。部mo,BO、用中人各阶段平均得~曲线、f用中入各阶段务策略入虫草曲线、图l图是局中人各阶段平均得分曲线及策略人数曲线在整个仿真过程中元论从得分还是人数上D策略都优于<#'>C策略这是由于囚徒困境博弈中存在一个纳什均衡(由表)。由于孤独者策略的引人从整个仿真过程中看任何一方都没有完全压制住另一方。它可以使上述三个策略形成一种类似于剪子包袱锤的循环相对优势关系从而有效地避免了共同欺骗的冻结状态(系统中的两个策略共同存在的状态消失系统进入一个纯策略的吸收态)。设置惩罚机制惩罚权重wCOU~叫(ti=D)AND(t=<#'>C)JjεN(i)以t)εTi}惩罚系数=。惩罚后更j新当前局中人的实际支付到=pωrand,randξ()。图:初始期望E~εJE~εZ期望更新系数可=侧重度α=(局中人完全依靠历史最大支付值)重复次数。<#'>C策略局中人的平均收益远大于D策略局中人说明惩罚机制有效地遏制了背叛的出现引领了合作的到来。但在仿真过程中明显地可以看到在一次博弈中D策略局中人的平均收益突然增加超过<#'>C策略局中人这是由于仿真过程中出现了惩罚失效的情况导致背叛偶然会得到巨大的收益。模糊系统与数学年电z,闺正日凶回立JO图惩罚扰动如果惩罚偶然失败或惩罚的力度得不到一定的保障。设惩罚失败的概率P如果惩罚失败那么惩罚系数要更新f=frand,randε()(以下仿真重复次)图:初始期望E~εJEεZ期望更新系数平=o,P=o侧重度α=(局中人完全依靠历史最大支付值)。图:初始期望EjεJE~εZ期望更新系数可=o,P=o侧重度α=(局中人完全依赖当前支付值)。必~十rH币。国飞回#哼曲曲担剧团由川剧目局中人各险段平均得分曲线、篇中λ各阶段平均得分曲线图图图:初始期望E~ξJE~εZ期望更新系数市=o,P=o侧重度α#D=laCL(使用D策略的局中人完全依赖历史最大支付值而使用<#'>C、L策略的局中人完全依赖当前支付)。第期张宏伟周宽宽等:重复囚徒困境博弈中的社会行为仿真图:初始期望E~ξJE~εZ期望更新系数j=P=侧重度α#D=α#CL=O(使用D策略的局中人完全依赖历史最大支付值而使用<#'>C、L策略的局中人侧重当前支付)。图图从以上对于侧重系数α的测试中可以看出在惩罚偶然失败或惩罚的力度得不到一定的保障的前提下使用策略D的局中人要更加侧重历史最大支付也就是说要使用最大支付来更新下一阶段的期望值而且要迫使<#'>C策略局中人在更新下阶段期望值时更加侧重历史最大支付D策略局中人在社会中才有可能得到发展机会。而使用策略<#'>C的局中人不能有贪念步步为营全完采用当前支付做为下一阶段的期望值更新标准那么就可以完全压制住D策略局中人(图、图、图)虽然D策略局中人在极其偶然的情况下也会有收益超过<#'>C策略局中人但在整个仿真过程中出现了D局中人消失的情况(图中的间断部分表示元人使用此策略)。所以如果惩罚策略不稳定使用<#'>C策略局中人最好的方式是不要冒进以当前所得作为标准对下一阶段的期望进行更新。仿真社会流动流动过程为z对随机选取的m个局中人分别与随机选取的一个邻居互换位置。取mεJ以人为一个档次进行变动共进行次仿真记录在设置惩罚机制(图)及无惩罚机制(图)下的平均人数变动和平均收益变动。根据流动人数的变动、节所示的分析指标及惩罚机制绘制图、图。I~^f飞飞飞、lf~v飞良、U叭A。分RJV句nu平均得曲线平均得分曲线、图图由上图不难得出随着流动局中人的增加模糊系统与数学年<#'>C策略局中人的平均人数和平均得分呈下降趋势而对D策略局中人而言呈缓慢上升态势。分析结果表明流动不利于合作的出现。结论从上面所做的仿真来看仅依靠局中人的个体理性行为(期望)达到群体合作不能保证一定成功。而从外部加以干涉(设置惩罚机制)却可以很成功的达到群体合作的效果L策略的引人避免了冻结状态的出现。当然惩罚会出现扰动文中也给出了扰动的分析结果。最后社会的流动特别是频繁剧烈地流动不利于合作的出现。参考文献:lJDeVreedeG,VanEijckDTModelingandsimulatingorganizationalcoordinationJJSimulationGaming():~J张维迎博弈论与信息经济学MJ上海三联书店J张涛基于累积期望差异评价策略的重复博弈仿真研究口工系统工程():~J李云囚徒困境中的合作进化大连理工大学:~J张发重复囚徒困境博弈中社会合作的仿真DJ系统工程理论方法应用():~SocialBehaviorintheSimulationofIteratedQrisoner’sDilemmaZHANGHongwei,ZHOUKuankuan,HUNengbing(SchofMathematicsandComputerScienceChangshaUniversityofScienceTechnologyChangshaChina)Abstract:MostofeconomicactioncanregardedasaspecialcaseofgametheoryThisarticlethroughanalysisofcomputersimulationforthecharacteristicsofIteratedPrisoner’sDilemma,arepeatedgamemodelbasedontheevaluationofthecumulativeaspirationtenseisbuiltandtheresultofmodulationisanalyzedTheresultsshowthatitcanprovidedynamicdescriptionforthebehaviorofsocialgroupalongwithtimeprolong,anditcouldprovideaidsforrepeatedgameresearchKeywords:IteratedDilemmaTheCumulativeAspirationTenseLonelyStrategySimulationSociety






秦先生 『上海买保险』上海:高端医疗 全球医疗 国际医疗保险经纪人 上海外籍人士买保险-高端人士医疗办理
服务项目:国际医疗保险/免现金结算/儿童疫苗/高端国际寿险/高端重疾险
免费热线『上海』:13761630213, QQ:107242375, Email:13761630213@163.com
选择保险事业 为了爱,为了一份坚定的承诺!微信: 咨询站
上海地区请直接拨打本人电话,应约免费上门提供免费保险方案。
Bupa保柏,   Cigna信诺,   MSH法国万欣和,   GBG全球利益集团,   AXA金盛,   Winterthur丰泰 
友情链接: 走在上海人寿保险的前端    医疗保险情报网   Shanghai Insurance    秦先生的个人简历


------分隔线----------------------------
☆ 高端医疗保险超市 微博更新 ☆
上海保险规划师信息
上海保险规划师信息
外籍人士高端医疗方案推荐
保柏 金盛全球
美国安泰atena 招商信诺
seven corners
安联全球医疗 中国人寿
美国国际医疗集团 MSH china
MSH china
美国安泰atena MSH china
美国安泰atena MSH china
免费咨询国际医疗保险
上海买保险
通过网络取得初步咨询
微信备注“保险咨询”
微信咨询
微信咨询
China Expats Medical insurance
上海买保险,高端医疗保险,bupa儿童疫苗,友邦保险,肺炎疫苗,进口疫苗,儿童保险,儿童医疗,医疗保险,中国人寿保险,保险公司,中国平安保险,医疗险,国际医疗保险,自费药,外籍人士医疗,泰康人寿,英国保诚集团,上海综合保险,国际医疗保险,上海社会保险,上海养老保险,北京高端医疗,招商信诺高端医疗,上海太平洋保险,和睦家医院,上海综合保险卡,买保险,高端医疗,重大疾病,意外伤害,定期寿险,家庭理财,友邦保险,美华妇儿,和睦家保险