求下列策略型博弈的全部什么是纯策略纳什均衡衡和混合纳什策略。

  会出现的,根据四个均衡可以推出纯策略纳什均衡和混合策略纳什均衡会同时存在。 严格占优策略均衡、重复剔除的占优策略均衡、纯策略纳什均衡和混合策略纳什均衡。一般将上述四种均衡统称为纳什均衡。 在这四种均衡概念中每种均衡依次是前一种均衡的扩展。前一种均衡是后一种均衡的特例。严格占优策略均衡是重复剔除的占优策略均衡的特例;重复剔除的占优策略均衡是纯策略纳什均衡的特例;纯策略纳什均衡是混合策略纳什均衡的特例。   如果将完全信息静态博弈中存在某种均衡的所有博弈定义为一个集合,那么就存在前一种均衡的博弈集合是后一种均衡的博弈集合的子集。完全信息静态博弈四种均衡概念之间的关系可以用图表示。 纯策略纳什均衡是指在一个纯策略组合中,如果给定其他的策略不变,该节点不会单方面改变自己的策略,否则不会使节点访问代价变小。   也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。   混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。

混合策略是参与对策的局中人以一定的概率值随机地选取的策略。它可以用向量形式进行表述。在矩阵对策中,它只有在没有鞍点的情况下才出现。因为在矩阵对策中没有鞍点时,参与对策的局中人无法有目的地选取对策来求得平衡局势,只有随机地从策略集合中选取策略。

:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。

:如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动,称为纯策略,简称“策略” ,即参与人在其策略空间中选取唯一确定的策略。

混合策略:如果一个策略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动,称为混合策略。参与人采取的不是明确唯一的策略,而是其策略空间上的一种概率分布。

混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈”。

:一般将严格占优策略均衡、重复剔除的占优策略均衡、纯策略纳什均衡和

。严格占优策略均衡是重复剔除的占优策略均衡的特例;重复剔除的占优策略均衡是纯策略纳什均衡的特例;纯策略纳什均衡是混合策略纳什均衡的特例。

混合策略纳什均衡(MNE):由最优的混合策略构成的混合策略组合。

中,如果在每个给定信息下,只能选择一种特定策略,这个策略为

。如果在每个给定信息下只以某种概率选择不同策略,称为混合策略。

混合策略是纯策略在空间上的

。纯策略可以理解为混合策略的特例,即在诸多策略中,选择该纯策略的概率为1,选其他纯策略的概率为0。纯策略的收益可以用效用表示,混合策略的收益只能以预期效用表示。

两个参与人各拿一枚硬币,并选择出正面向上还是反面向上。若两枚硬币是一致的(即全部正面或全部反面),则参与人2赢走参与人1的硬币;若两枚硬币不一致(一正一反),参与人1赢得参与人2的硬币。支付如表1:

  1. 在这类博弈中,不存在纯策略纳什均衡;

  2. 参与人的支付取决于其他参与人的策略,以某种概率分布随机地选择不同的行动;

  3. 每个参与人都想猜透对方的策略,而每个参与人又不愿意让对方猜透自己的策略。
      这种博弈的类型是混合策略。

由最优的混合策略构成的混合策略组合。由于混合策略伴随的是支付的不确定性,因此参与人关心的是其期望效用。最优混合策略是指在给定对方的混合策略的情况下,使期望效用函数最大的混合策略。在两人博弈里,混合策略纳什均衡是两个参与人的最优混合策略的组合。

2.收益相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望收益相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略收益相等,构成方程组求解。

3.最优反应函数法:在连续纯策略均衡时(如

),可以使用反应对应的概念来描述一个参与人对应于其他参与人混合策略的最优选择。

上述模型有混合策略纳什均衡:参与人以一定的概率选择某种策略,然后计算相应于不同概率的期望效用。

设:政府救济的概率θ=1/2 ,不救济的概率1-θ=1/2。流浪汉寻找工作的期望效用:1/2×2+1/2 ×1=1.5;
  流浪的期望效用: 1/2×3+1/2 ×0=1.5。此时,流浪汉选择任何混合策略的期望效用都是1.5,则流浪汉的任何一种策略(纯的γ=1或γ=0或混合的0<γ<1)都是政府所选择的混合策略的最优反应。

如果流浪汉选择这个混合策略,政府的任何策略(混合的或纯的)带给政府的期望效用为-0.2。特别的,以1/2的概率分别选择救济和不救济当然也是政府对于流浪汉所选择的混合策略的最优反应。这样可以得到一个混合策略组合,每一个参与人的混合策略都是给定对方混合策略是的最优选择,从而构成混合策略纳什均衡。

混合策略在生活、工作、学习等都有广泛的应用。基于混合策略,可以进行竞合博弈分析,也可以进行混合策略纳什均衡研究等。例如,在研究乒乓球竞赛发球与接发球博弈上,可以知道乒乓球战术行为博弈的"混合策略"是纯策略的概率组合,混合策略是连续策略的一种特例。最优反应分析能够用来求解乒乓球战术行为博弈的混合策略均衡,在运动实践中乒乓球运动员(博弈方)博弈过程中都存在各自的最优反应规则,并能够根据这一规则构建最优反映曲线,最终得出乒乓球战术行为

解。乒乓球战术行为中"混合策略"的重要性在于揭示了博弈双方也就是乒乓球运动员一定不能使自己的战术行为表现出很强的规律性,因为一旦被对手发觉那么就将处于劣势状态。

  • 何盛明.财经大辞典:中国财政经济出版社,1990年12月
  • 2. 王国华 梁樑.决策理论与方法.安徽:中国科学技术出版社,2014.
  • 3. 教材编写组.运筹学.北京:清华大学出版社,2012.
  • 4. 刘文明,唐建军. 乒乓球竞赛发球与接发球博弈的混合策略纳什均衡研究[J].

专业文档是百度文库认证用户/机构上传的专业性文档,文库VIP用户或购买专业文档下载特权礼包的其他会员用户可用专业文档下载特权免费下载专业文档。只要带有以下“专业文档”标识的文档便是该类文档。

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取,非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档。

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取,非会员用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档。

付费文档是百度文库认证用户/机构上传的专业性文档,需要文库用户支付人民币获取,具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档。

共享文档是百度文库用户免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定。只要带有以下“共享文档”标识的文档便是该类文档。

我要回帖

更多关于 纯策略纳什均衡 的文章

 

随机推荐