博弈论:主导策略解析
博弈论:主导策略解析
博弈论中的主导策略是指一个玩家拥有比另一个玩家更强大、更有效的策略。这意味着当一个玩家部署该策略时,无论对手使用什么策略,他都会比对手更有利。本文将从主导策略的基本定义出发,逐步深入探讨其类型、识别方法、应用示例以及局限性。
图片:Shutterstock/内置
一、说明
博弈论中,主导策略是指一个玩家比另一个玩家拥有更占主导地位的策略。正如我们所见,均衡主导策略解决方案概念可能是一个有用的工具。在囚徒困境中,一旦玩家 1 意识到自己有一个主导策略,他就不必考虑玩家 2 会做什么。玩家 1 知道他可以只发挥自己的主导策略,而且比发挥其他策略更好。所有玩家都具有主导策略的游戏仍然具有战略性,因为收益取决于其他玩家的行为,但最佳反应则不然。
二、主导策略概念和应用
2.1 博弈论中的主导策略是什么?
博弈论中的主导策略是指一个玩家拥有比另一个玩家更强大、更有效的策略。这意味着当一个玩家部署该策略时,无论对手使用什么策略,他都会比对手更有利。
但如果不是所有玩家都采用主导策略会怎样?如果没有玩家采用主导策略会怎样?
2.2 如何在博弈论中识别主导策略
迭代删除主导策略是一种常见但繁琐的技术,用于解决没有严格主导策略的游戏。它涉及迭代删除主导策略。主导策略有两种类型。
2.3 博弈论中的主导策略类型
- 严格支配策略:无论对手选择什么策略,这种策略总是比其他策略产生更差的结果。
- 弱主导策略:这种策略会产生与替代策略相同或更差的结果。
在迭代删除过程的第一步中,最多会从每个玩家的策略空间中删除一个主导策略,因为没有理性的玩家会采用这些策略。这会导致一个新的、更小的游戏。
一些之前未被主导的策略可能会在较小的游戏中被主导。重复第一步,创建一个新的、甚至更小的游戏,依此类推。当没有为任何玩家找到主导策略时,该过程停止。
这个过程是有效的,因为它假设参与者之间的理性是常识。也就是说,每个参与者都知道其他参与者是理性的,每个参与者都知道其他参与者知道他知道其他参与者是理性的,依此类推,直到无穷。
此过程有两个版本。第一个(也是首选)版本仅涉及消除严格支配策略。如果完成此过程后,每个玩家只剩下一个策略,则该策略集是唯一的纳什均衡。
第二个版本涉及消除严格和弱支配策略。如果在过程结束时,每个玩家只有一个策略,则该策略集也是纳什均衡。与第一个过程不同,消除弱支配策略可能会消除一些纳什均衡。因此,通过消除弱支配策略找到的纳什均衡可能不是唯一的纳什均衡。在某些游戏中,如果我们以不同的顺序消除弱支配策略,我们最终可能会得到不同的纳什均衡。
我使用了很多术语,所以让我们看一个例子来澄清这些概念。
有关数据科学的更多信息需要了解的基本概率论和统计学术语
2.4 主导策略示例
考虑以下战略情况,我们想将其表示为一场游戏。
市中心有两家酒吧,A 和 B,彼此相邻。每家酒吧都力求实现收入最大化,并选择将啤酒定价为 2 美元、4 美元或 5 美元。每家酒吧都有 60 位潜在客户,其中 20 位是当地人,40 位是游客。当地人会从定价最低的酒吧购买(如果两家酒吧定价相同,他们会随机选择)。无论如何,游客都会随机选择一家酒吧。
2.5 创建收益矩阵
一旦我们确定了参与者和策略,我们就可以开始创建收益矩阵:
空的收益矩阵。| 图片:Michael Kingston
现在,我们可以填写收益。我们被告知,每个酒吧只关心最大化收入(售出的啤酒数量乘以价格)。让我们看看策略概况($2,$5)。也就是说,当酒吧 A 收取 2 美元,酒吧 B 收取 5 美元时。在这种情况下,所有当地人都会去酒吧 A,一半的游客也会去。这使得酒吧 A 总共以每瓶 2 美元的价格出售 40 瓶啤酒,或收入 80 美元。酒吧 B 由于价格较高,只能吸引一半的游客。这使得酒吧 B 总共以每瓶 5 美元的价格出售 20 瓶啤酒,或收入 100 美元。
开始填充矩阵。|图片:Michael Kingston
然后我们可以填写表格的其余部分,以相同的方式计算收入。
已完成的收益矩阵。| 图片:Michael Kingston
首先要注意的是,双方都没有主导策略。对于酒吧 A 来说,无论酒吧 B 设定什么价格,都没有任何价格能给它带来比任何其他价格更高的收益。例如,如果酒吧 B 定价为 5 美元,那么 4 美元的价格将使酒吧 A 的收益高于任何其他价格。但如果酒吧 B 不定价为 5 美元,而是将啤酒定价为 2 美元,情况会怎样?在这种情况下,定价为 4 美元不再是酒吧 A 的最佳应对措施。定价为 5 美元才是最佳应对措施。
2.6 严格支配策略示例
我们迄今为止开发的解决方案概念——均衡主导策略——在这里没有用。
优势策略均衡的逻辑是,如果玩家的策略总是最佳的,我们期望他会采用这种策略。但如果玩家的策略总是比其他策略差呢?我们可以合理地期望他永远不会采用总是比其他策略差的策略。
如果对于其他所有玩家的所有可能策略组合,S' 给玩家 i 的收益高于 S,则表示玩家 i 的策略 S 严格受另一个策略 S' 支配。
在上述游戏中,是否有任何一方的策略是严格受制于策略的?是的。策略“$2”给 A 的收益总是低于“$4”或“$5”。让我们看看为什么 A 的策略严格受策略 $4 的支配:
- 如果预计 Bar B 出价 2 美元,那么 Bar A 也可以通过出价 2 美元获得 60 美元,并可获得 80 美元。
- 如果预计 B 酒吧将出价 4 美元,那么 A 酒吧同样出价 2 美元可获得 80 美元,同样出价 4 美元可获得 120 美元
- 如果预计酒吧 B 出价 5 美元,那么酒吧 A 出价 2 美元即可获得 80 美元,出价 4 美元即可获得 160 美元。
因此,酒吧 A 永远不会采用 2 美元的策略。对于酒吧 A 的对手可能采用的任何策略,都存在比 2 美元策略收益更高的策略。我们可以概括为理性玩家永远不会采用严格支配策略。
有关数据科学的更多信息每位数据科学家都需要的 4 项基本技能
三、严格支配策略的迭代删除示例
3.1 第一轮删除
到目前为止,我们得出结论,酒吧 A 永远不会玩 2 美元,但这是一场完全信息游戏。酒吧 B 知道酒吧 A 的收益。因此,如果我们能发现酒吧 A 永远不会玩 2 美元,因为它是一种严格占优策略,那么酒吧 B 也能发现这一点。因此,酒吧 B 可以合理地预期酒吧 A 永远不会玩 2 美元。
这是一个对称博弈,因此酒吧 B 也适用。2 美元是酒吧 B 的严格主导策略,酒吧 A 也知道这一点。我们可以从收益矩阵中删除主导策略,如下所示:
第一轮删除。
通过这样做,我们失去了与采用主导策略的策略配置文件相对应的所有单元格。这正是我们的目标,即从我们认为可行的结果集合中删除采用主导策略的结果。
3.2 第二轮删除
现在我们只剩下四种策略配置(以及四种相应的结果)。现在让我们再次站在 A 的角度。A 知道它不会打出 2 美元,它的对手也不会。A 还知道 B 知道这一点。现在 A 正在比较 4 美元和 5 美元的策略,并注意到,一旦 2 美元的策略对两位玩家来说都不再有效,5 美元的策略就会被 4 美元的策略所取代。即:
- 如果 B 啤酒的定价为 4 美元,则净收入为 120 美元,而定价为 5 美元,则净收入为 100 美元。
- 如果 B 定价为 5 美元,则定价为 4 美元可获得 160 美元,而定价为 5 美元可获得 150 美元
定价 5 美元只是对 2 美元的最佳回应,但 2 美元永远不会被玩,因此定价 5 美元永远不会是对理性玩家会采取的任何策略的最佳回应。因此,我们可以将其从矩阵中删除。游戏是对称的,因此同样的推理也适用于 Bar B。
第二轮删除。
现在我们只剩下一个策略概况——两家酒吧的啤酒价格均为 4 美元。我们使用了迭代删除主导策略的方法,得出了这一策略概况。
- 迭代删除主导策略:这种方法首先从原始收益矩阵中删除任何严格主导的策略。完成第一步删除后,研究简化矩阵,并删除此新简化矩阵中任何主导策略。此过程持续进行,直到无法删除任何策略。
- 合理化策略:当反复删除主导策略后只剩下一个策略配置时,游戏就被称为主导可解。更一般地,在反复删除严格主导策略后剩下的策略被称为合理化策略。
- 严格主导策略中的均衡:在严格主导策略中寻找均衡涉及找到一种始终是每个玩家的最佳响应的策略,而通过迭代删除寻找均衡涉及迭代地从考虑策略中扣除永远不是最佳响应的策略。请注意,根据定义,主导策略(如果存在)严格主导所有其他策略。
四、主导策略方法的缺点
这两种方法都有一个共同的主要缺点,它们并不总是将游戏中可能发生的情况缩小到可处理的少数可能性中。例如,只有当所有玩家都采用主导策略时,游戏才会在主导策略中达到均衡。如果不是这种情况,那么这种解决方案概念就没什么用。
类似地,有些游戏可能没有任何可以通过迭代删除来删除的策略。即使在确实有一些主导策略的游戏中,剩余的可合理化策略集也可能非常大。预测能力可能不够精确,无法发挥作用。
如果玩家采取的策略比其他策略能带来更高的收益,那么无论其他玩家在做什么,该策略都算作玩家拥有主导策略。如果玩家拥有主导策略,那么他们就会使用它。
如果玩家的策略比其他策略的收益低,那么无论其他玩家做什么,该策略都算作严格支配策略。如果你有一个严格支配策略,那么其他玩家就会预料到你永远不会采用这种策略,并据此选择行动。
我们研究了两种寻找游戏“可能”结果的方法。
- 寻找主导策略均衡。如果存在主导策略,那么这很好,但是,通常不存在主导策略。这限制了此解决方案概念的实用性。
- 迭代删除严格支配策略。迭代删除是一种有用的(尽管有些麻烦)工具,可用于从考虑中删除支配策略。
然而,这两种方法都不能保证返回一组可处理的较小预期结果。幸运的是,有一种解决方案概念可以保证返回一组可处理的较小预期结果,即纳什均衡。
参考文章:
论中Dominated Strategy in Game Theory Explained | Built In的主导策略是指一个玩家的策略
比另一个玩家更具主导性。以下是它如何帮助您确定最佳行动。
迈克尔·金斯顿