寻找3x3混合策略纳什均衡衡问题

科学教育 | 学习帮助 | 出国/留学 | 工程技术科学 | 教育/科学 | 英语听力 | 梦幻西游电脑版 | 视频会议 | 口臭 | 暗黑破坏神3（游戏） | 面相 | 赛尔号 | linux | 山西省 | Xbox One | 思修 | 易经 | solidworks | 钢铁雄心4 | 休闲游戏 | 魔兽争霸3混乱之治 | 显卡 | 武汉大学 | 塞尔达传说（游戏） | 校服 | 剑侠情缘网络版叁 | 脱发 | 日本文化 | 数学建模 | 二次元 | 部落冲突（游戏） | 肖战 | 街机游戏 | 拳皇 | 马鞍山市 | 扑克 | 完美世界（游戏） | 三国志（游戏） | 热血传奇（游戏） | 意大利 | 跆拳道 | 东莞市 | 糖尿病 | 古琴 | 三国 | 电视节目 | 百度 | qq音乐 | 配音 | 电视 | 任天堂 | 科幻小说 | 虚拟专用服务器 | QQ游戏 | 大熊猫 | 微电影 | Android | 竞技游戏 | 动画制作 | QQ炫舞 | 电源 | 日语 | 魔兽争霸3冰封王座 | 产业 | ios开发 | 百度云 | 动画电影 | nba篮球 | 羽生结弦 | iOS应用 | galgame | 电吉他 | 平板电脑 | 周星驰（人物） | 离婚 | 后宫·甄嬛传（书籍） | 牙科 | 游戏开发 | 网络直播 | ios游戏 | 电子邮件 | SNH48 | 民国 | 美容 | 舰队 Collection | 心理 | Mac | 羽毛球技术 | 互联网公司 | 大学生兼职 | 烘焙 | 诸葛亮 | 跑跑卡丁车 | 武侠小说 | 微博 | 骨折 | 掌上游戏机 | 玉米 | 中国足球 | 电脑配置 | 洛奇英雄传 | 硬盘 | 张璐 | akb48 | 炉石传说 | 韩国 | 蓄电池 | QQ空间 | 房贷 | 麦克风 | 相声演员 | 抑郁 | 天下2（游戏） | 农业科学 | 神话 | 农历 | 中国足球协会超级联赛（CSL） | 流星花园 | 易烊千玺 | 火影忍者 | 日语歌曲 | 巴西 | 红酒 | 化疗 | 占地 | 网络小说 | 香烟 | 传奇世界 | 名字 | 日本电影 | 表演 | 西藏自治区 | 英雄传说：闪之轨迹（游戏） | 足球彩票 | 摩尔庄园 | 中国工商银行 | 游戏手柄 | 陈奕迅 | 联赛 | 天体物理学 | 英格兰足球超级联赛 | 超级机器人大战 | 命令与征服：红色警戒2（游戏） | 郭富城 | 一级方程式赛车（f1） | Adobe Photoshop | 英文歌曲 | 玄幻小说 | 猫和老鼠 | 杨凡 | 书籍改编电影 | 俄罗斯 | 网络赚钱 | 罗玉凤 | 刺客信条2 | 角色扮演 | 食物 | 药物 | 杨洋（演员） | 信息安全 | 胡歌（演员） | 张子枫 | 古典音乐 | 时尚 | 大片 | 电脑游戏 | 签证 | 徐佳莹 | 耽美 | 游戏攻略 | 音乐剧 | 前女友 | 男性 | 肠胃 | 刺客信条起源 | 剧场版 | 国际足联世界杯 | 彩虹六号（游戏） | 赵丽颖（演员） | 天体生物学 | 战神（游戏） | 吉他学习 | 飞机 | 三菱商事 | 关节炎 | 斗鱼直播 | 发电 | 张继科 | 华语流行音乐 | 搏击项目 | 主题曲 | 李信 | 刘德华（演员） | 即时战略游戏（RTS） | 欧阳娜娜 | 网址导航 | 海贼王 | 山地车 | 豆瓣电影 | 广场舞 |

你的位置：网站首页 >> 频道首页 >>经济学 >>寻找3x3混合策略纳什均衡衡问题

寻找3x3混合策略纳什均衡衡问题

来源：蜘蛛抓取(WebSpider) 时间：2020-10-25 07:25 标签： 3x3混合策略纳什均衡

有两个纯战略纳什均衡（AX）和（B，Y）消去Z列，如下

假定第一人的混合战略σ1=（θ，1-θ），第二人的混合战略σ2=（γ，1-γ）。

求U1对θ的一阶偏导并使其为零，

求U2对γ的一阶偏导并使其为零，

θ*=0.4，γ*=0.75为此博弈的一个混合战略纳什均衡

用一种错误去纠正另一种错误，并不能使错误得以消除；用一种邪恶來对抗另一种邪恶最终会使邪恶得以壮大。——罗鹏

消去最后一列然后求解

为什么是消去最后一列是因为最后一列中不存在纳什均衡嗎

前面我们学习了策略式博弈的納什均衡。每个玩家可选的策略也叫纯策略在前面讲的纳什均衡中，每个玩家都要选定一个纯策略但有的时候并不能找到一个纯策略嘚纳什均衡，举例如下：

还有一个常见的例子：石头剪刀布就没有纯策略的纳什均衡。

这个时候需要引入新的概念——混合策略。

以石头剪刀布为例无论双方采用哪种策略组合，输的一方总可以改变策略使自己反败为胜因此没有纯策略的纳什均衡。通过引入“随机性”来解决这个问题

通俗地解释，混合策略就是在纯策略上加上概率在一次博弈中，玩家随机地选择一种纯策略

在前面的一节学习叻纯策略的表示：玩家i的策略集，纯策略

混合策略是给每个纯策略分配一个概率，一个玩家的策略集就是一个“样本空间”

用表示上嘚概率分布，即：

混合策略博弈的博弈结果

在这样一个“随机”的博弈中收益如何计算呢？这就需要计算期望的收益了期望的收益就昰纯策略的博弈结果的收益乘上这个结果出现的概率，对每个博弈结果进行求和

给定一个策略式博弈和一个混合策略博弈结果，玩家的期望收益是

(假设每个玩家的决策是独立的因此是每个玩家的相应策略的概率乘积)

3. 形式化——混合策略博弈

在下面的博弈中，假设是策略U囷策略L的概率那么：

1. 定义：混合策略纳什均衡(MNE)

通俗地解释就是：每个玩家都选择在对手不改变的情况下的最好的分布

定理：是MNE当且仅当對于所有的，

3. 存在性：纳什定理

定理：有限的策略式博弈一定存在混合策略纳什均衡

有限指：有限的玩家每个玩家都有有限种纯策略。

4、求解混合策略纳什均衡

定理：是MNE当且仅当玩家的每个具有正概率的纯策略都是的最优反应(证明略)

也就是说，玩家选任意一种纯策略的期望收益是相同的

用这个定理来求解MNE

设玩家1选择U的概率是，玩家2选择L的概率是

由玩家2选L的期望收益等于玩家2选R的期望收益得式子：由玩家1选U的期望收益等于玩家1选D的期望收益，得式子：

”玩家选任意一种纯策略的期望收益是相同的“也可以这么想：如果玩家的纯策略的期望收益不同的话那么他会一直选期望收益高的那个，也就是选择一个纯策略而不是混合策略。这样就回到了纯策略博弈的时代开篇的例子又说明了有些博弈是找不到纯策略的均衡的。

因此如果想保持一种”稳定“的局面，每个玩家都没有动机改变当前的策略(或分咘)就要保证它选择每个策略的期望收益都相同。

混合策略纳什均衡的定义及求解

欢迎提出建议指正错误，也欢迎一起讨论~

混合策略均衡求解的一个原则是混合策略均衡赋予正概率的所有纯策略的期望收益相等从上图可见，这个博弈没有纯策略的纳什均衡所以我们只能去寻找混合策略的納什均衡。假设在均衡状态下A,B,C三个参与者的混合策略分别是：A (a1,a2); B(b1,b2); C(c1,c2). 那么对不同参与者来说在均衡状态下，不同纯策略的期望收益分别是：

突破点是参与者B的两个期望收益,

如果参与者B选择混合策略

所以这道题的混合策略纳什均衡是：

参与者B选择混合策略的情况下

，给定A和C的策畧B选B1（纯策略，b1=1混合策略的特殊情况）是唯一符合条件的情况，而以上的均衡也是这个情况下唯一的均衡

到此，唯一没有涵盖的情況是

参与者B选择纯策略B2的情况(b1=0,b2=1)在这个情况下参与者A和C的期望收益分别是：

但是在这个情况下,代入参与者B:

综上所述，这个博弈唯一的纳什均衡是：