问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

博弈论中的抛硬币游戏:如何找到纳什均衡策略

创作时间:
2025-03-13 16:45:57
作者:
@小白创作中心

博弈论中的抛硬币游戏:如何找到纳什均衡策略

引用
简书
1.
https://www.jianshu.com/p/2aec229280cd

在一个图书馆里,一位陌生美女主动提出要和你玩一个数学游戏。她提议你们各自亮出硬币的一面,如果都是正面,她给你3元;如果都是反面,她给你1元;其他情况你给她2元。那么,这个游戏是否值得参与呢?让我们用博弈论来分析这个问题。

每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。

损益表

假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,由此列出方程就是
3x + (-2)(1-x) = (-2) * x + 1*( 1-x )——解方程得x=3/8;
同样,美女的收益,列方程-3y + 2( 1-y) = 2y+ (-1) * ( 1-y)——解得y也等于3/8。

于是,我们就可以算美女每次的期望收益是:(1-y)(2x-(1-x)) + y(-3x+2(1-x)) = 1/8元,也就是说,双方都采取最优策略的情况下,平均每次美女赢1/8元。

计算解释:
1.(1-y)(2x-(1-x)) 代表着:美女出反面时,获得的收益 = 你出正面美女的损益 + 你出反面美女的损益
2.y(-3x+2(1-x)) 代表着:美女出正面时,获得的收益 = 你出正面美女的损益 + 你出反面美女的损益

其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。

如果你全部出正面,你每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;
如果你全部出反面,你每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。

如果你用完全随机 (1/2, 1/2) 策略,你的收益是 1/2 * (3/8 * 3 + 5/8 * (-2)) + 1/2 * (3/8 * (-2) + 5/8 * 1) = -1/8;

计算解释:
1.1/2 * (3/8 * 3 + 5/8 * (-2)) 代表着:当你有1/2的概率出正面的时候,你的收益为:美女出正面的概率你的损益 + 美女出反面的概率你的损益
2.1/2 * (3/8 * (-2) + 5/8 * 1) 代表着:当你有1/2的概率出反面的时候,你的收益为:美女出正面的概率你的损益 + 美女出反面的概率你的损益

实际上,不论你用什么策略,你的收益都是 -1/8,也就是说,随便玩一种策略,你都是在纳什均衡状态中的,所以,这个把戏你随便怎么玩,都是亏的。

这个例子中是没有纯战略纳什均衡的,因为只出一种策略,肯定有一方要亏钱,所以并不是其均衡状态(明明只要换一边就可以赚钱了,所以不是最佳策略);而混合纳什均衡是纯在的,事实上,Nash告诉我们“每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在”,如果美女出(3/8,5/8)这个方案,另一边任何玩法都是期望收益一样的,也就满足了纳什均衡的条件。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号