问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

【游戏设计原理】17 - 纳什均衡

创作时间:
作者:
@小白创作中心

【游戏设计原理】17 - 纳什均衡

引用
CSDN
1.
https://m.blog.csdn.net/tealcwu/article/details/144609105

纳什均衡是博弈论中的一个重要概念,它描述了在多人博弈中,当所有参与者都选择最优策略时,任何一方单独改变策略都无法获得更大利益的状态。这一概念不仅在理论上有重要价值,在实际应用中,特别是在游戏设计领域,纳什均衡更是帮助设计师理解玩家行为、预测策略选择的重要工具。

一、原理总结与分析

核心概念
纳什均衡(Nash Equilibrium)是博弈论中一个重要的均衡概念。它指在一个包含多个参与方、彼此策略相互影响的局面中,存在这样一种策略组合,使得当所有其他参与者的策略都固定时,任何单独的参与者都没有动力单方面改变自己的策略。这意味着各方在该均衡策略下达成了一种稳定的相互预期,谁也无法通过个人的单独变动而获得更大利益。

关键特征

  1. 稳定性:在纳什均衡点上,没有人想先改变策略,因为单方面调整策略只会降低他们的收益。
  2. 不一定是帕累托最优:纳什均衡所对应的结果不一定能实现整体资源配置的最优化(帕累托最优)。有时均衡点是一种“次优”的均衡,即各方的理性选择互相制约,导致最终结果并非最好,但却是相对稳定的。
  3. 信息对称与共识前提:纳什均衡的预测前提是各方对博弈结构、可用策略和收益有着充分的共识与信息了解。在信息不对称的环境中,预测的准确性会受到影响。

典型例子

  • 三连棋(Tic-Tac-Toe):在两名理性玩家对弈时,最终策略组合往往以平局作为纳什均衡点——双方都没有动机改变自己的最优防守和进攻策略。
  • 囚徒困境(Prisoner’s Dilemma):双方都保持沉默是一个潜在均衡态(虽然并非严格意义上的囚徒困境标准解,但可看作一类纳什均衡),但由于理性计算下各自背叛得到的短期更高收益,实际稳定的纳什均衡往往是双方都选择背叛,从而得到并非最优却稳定的结果。

数学表示与判断

  • 在有穷策略的两人博弈中,可通过回报矩阵来判断纳什均衡。如果一个单元格(决策组合)在本行对行方来说是最高收益,在本列对列方来说也是最高收益,那么该单元格就是一个纳什均衡。
  • 当纳什均衡的某一方的回报值或相对关系改变,均衡也可能变化。

动态与超游戏策略

  • 现实中,参与人的不完全理性、信息不对称、风险偏好、沟通与协议的存在,会使得均衡策略发生偏移。
  • 反复博弈(迭代)的过程、信任与信誉建立、以及策略间的谈判与威慑(超游戏思维),会对最终的长期策略均衡产生影响。

二、在游戏设计中的应用

在游戏设计中,纳什均衡的概念可以帮助设计者理解玩家在面对一组规则、奖励与惩罚机制时如何作出稳定选择,从而预测玩家行为倾向,并合理设计游戏的互动、平衡和长期玩法。

  1. 平衡设计与稳定策略
    在多玩家对抗或合作的游戏中(如竞技游戏、策略类游戏、多人对战游戏等),设计者需确保不存在某个单方面 dominate(主导)策略。如果某种策略明显优于其他策略,玩家会倾向全部采用这种策略,导致游戏变得单调和无趣。利用纳什均衡思路,设计者可为各策略预设“此消彼长”的制衡关系,使得当所有玩家都选择一种策略时,另一个策略也有机会在该环境下变得有吸引力,借此维持生态的动态稳定。

  2. 决策反馈与心理博弈
    游戏设计中许多决策环节带有博弈色彩。例如,卡牌对战游戏中玩家的出牌策略、MOBA游戏中团队协作与资源分配、经济游戏中玩家之间的交易与谈判,都可能形成纳什均衡。设计者可以通过调整资源收益、风险程度、信息公开程度来影响玩家策略的优劣性,从而塑造玩家互动模式。在确保玩家感受到竞争性与合理性的前提下,均衡机制引导了玩家的长远规划与思考。

  3. 多人对战游戏的匹配与奖惩机制
    排位赛、锦标赛制度、积分和声望系统往往引导玩家采取一定的行为来达到更高阶层。通过纳什均衡的思维,设计者可判断当前规则下玩家可能长期选择的策略组合。如果玩家为了追求排名最大化,不断采用低风险策略(例如消极防守),游戏则可能变得停滞不前。这时,设计者可以增设鼓励进攻或冒险的奖励机制,让防守与进攻在平衡下形成新的均衡组合。

  4. 合作与背叛机制的平衡
    像“狼人杀”这类带有欺骗与信任要素的游戏中,纳什均衡会影响玩家的信任构建与决策行为。设计者可以有意设置奖惩结构,使得玩家相互合作(或保持一定程度的合作)成为一种相对稳定的策略。这可以通过复杂的回报设计实现,比如确保过度背叛会在长程游戏(多轮)中得不偿失,从而使玩家在反复博弈中趋向于达成某种长期稳定策略。

  5. 经济与资源分配类游戏
    在游戏内的经济系统与资源分配设计中,纳什均衡概念有助于预测玩家偏好:当资源产出与消耗的决策受到其他玩家行为影响时,通过构建一组参数,让市场形成某种均衡价格、供需关系或资源争夺的稳定点。当所有玩家在该点上进行决策时,不会轻易改变策略,从而让游戏经济系统更有逻辑性与持久性。

总而言之,纳什均衡的思想在游戏设计中可作为一项理论工具,帮助设计者预判玩家在特定规则与激励机制下的稳定策略组合,并由此不断调试、改进规则,使游戏在复杂互动中保持令人满意的平衡与乐趣。

原理 17 纳什均衡
纳什均衡是以它的发现者约翰·纳什(John Nash)命名的。他在约翰·冯·诺依曼(John von Neumann)和奥斯卡·摩根斯坦(Oskar Morganstern)等人“零和博弈”(参见原理 100“零和博弈”策略 Zero-Sum strategies)的研究基础上发展了这个概念。
纳什认为,在任意一个混合策略博弈中有这样一个策略组合:在该策略组合上,任何参与人都有有限的选择;而当所有其他人都不改变策略的时候,没有人会改变自己的策略,因为改变策略会导致该博弈者得到的得益降低。这样一个策略组合,就是纳什均衡。
当所有的参与人都有一个最佳选择,而且改变策略不会让他们得到更好的结果时,这就是一个纳什均衡。纳什均衡的结果不一定是该博弈中的“帕累托最优”(参见原理 18“帕累托最优”)结果。纳什均衡的例子包括:

  • 三连棋(Tic-Tac-Toe,纳什均衡的结果是平局);
  • 囚徒困境(双方都保持沉默就是一个纳什均衡)。
    纳什均衡原理可以用于预测博弈者在其最优策略的基础上互动的结果。如果不把另一方的行动考虑进来,纳什均衡就无法预测一个决定将带来的结果。因此,纳什均衡仅在博弈各方都对博弈的可能决策和结果有共识的情况下有效。这时,博弈各方都明白所有人可能的结果及回报,所以能判断出:
  • 哪个决策是对自己最有利的;
  • 哪个决策是对其他人最有利的。
    (参见原理 9“信息”和原理 27“信息透明”)

纳什均衡的数学表示

纳什均衡可以通过数学方法,基于回报矩阵(payoff matrix)得出。不过,只有在参与人数不多且可用策略较少的情况下,这种矩阵才便于使用。如果一个单元格中的第一个回报数字和第二个回报数字都分别是该列和该行中最高的,那么这个单元格所描述的情形就是纳什均衡。
例如,当一个游戏中有两个玩家,而他们分别有 4 种可能的策略,其回报矩阵如下(斜体字标出的为纳什均衡):

玩家1/玩家2
玩家2-A
玩家2-B
玩家2-C
玩家2-D
玩家1-A
0, 0
20, 15
0, 0
10, 10
玩家1-B
15, 20
0, 0
0, 10
10, 0
玩家1-C
10, 0
0, 10
15, 15
15, 15
玩家1-D
10, 10
10, 0
0, 15
15, 15

只要单元格中两个值的顺序没有改变,并且这两个值分别保持在该列和该行中最高,纳什均衡将保持稳定。
在上表中:

  • BA 的值为 15,20;
  • AB 的值为 20,15;
  • CC 和 DD 的值为 15,15;
    这些就是矩阵中的纳什均衡。如果 CC 和 DD 的值变成了 10,10,它们就不再是纳什均衡,因为它们所在的行或列中有比它更高的回报值。
    当然,错误、复杂性、不信任、风险和非理性行为都可能形响参与人的策略,导致他们选择低回报的策略,但他们可能会觉得他们有很充分的理由作出这样的选择。参与人之间的沟通(游戏之外的协议以及可信或不可信的威胁)也会影响选择,特别是在连续玩同样的游戏时。这些沟通可能导致一些超游戏的策略(参见原理 47“超游戏思维”)的产生比如以牙还牙。这种情况在两个人连续重复“因徒困境”(参见原理 20“因徒困境”)的情境时经常出现。纳什均衡也被用来分析政治和军事冲突(包括冷战时期的军备竞赛)、经济趋势(如货币危机),拥堵地区的交通流向。
    纳什均衡的应用也被用来支持另一个博理论“公地悲剧”(参见原理26“公地悲剧”)。如果博弈在纳什均衡的情况下反复进行(参见原理45“迭代”),博弈者之问的重复互动会带来形成一个长期策略的基础,并取代任何统计预测的结果。博弈者之问选择的合作性会更大,这在博弈者能够自由沟通的情况下尤其明显。

本文原文来自CSDN

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号