《学园偶像大师》AI揭秘:如何优化游戏平衡?
《学园偶像大师》AI揭秘:如何优化游戏平衡?
《学园偶像大师》(后简称学马仕)是日本游戏开发商QualiArts推出的一款现象级游戏,自上线以来便稳居畅销榜前列。其独特的玩法机制和精良的制作水准,吸引了大量玩家的关注和参与。然而,在这款融合了养成模式和卡牌构筑玩法的游戏中,如何保持长期的平衡性,成为了开发团队面临的一大挑战。
AI技术的引入
学马仕的玩法机制较为独特:玩家需要先构筑卡组,然后在养成环节的课程玩法中,从牌山里抽取手牌并打出,同时卡牌产生的效果也会随情况而变化。这种设计虽然增加了游戏的策略性和趣味性,但也带来了平衡性调整的巨大挑战。
为了解决这一难题,开发团队决定借助AI技术。他们开发了两套核心AI系统:卡组探索AI和课程AI,以及一套平衡性调整支持系统。这一决策不仅解决了游戏平衡性问题,也为整个游戏行业提供了宝贵的借鉴经验。
技术实现:双AI协同作战
卡组探索AI
卡组探索AI的主要任务是在庞大的组合当中寻找最强卡组。由于游戏刚上线时的卡牌和道具组合数就已超过10的20次方,每次更新时重新计算和排查一遍的做法显然不切实际。因此,开发团队采用了灰盒优化技术,并引入了大规模语言模型(LLM)的文本嵌入技术。
具体实现上,他们采用了遗传算法。该算法会将两个卡组组合起来生成子代卡组,评估高分解法,再将优秀解法继续组合生成下一代,并通过引入突发变化来寻找最佳解。通过使用LLM向量化的卡牌信息,实现了从黑盒优化到灰盒优化的升级。
课程AI
课程AI的主要目标是模拟玩家的实际对局过程。开发团队对其提出了三个核心要求:
- 任何情况下都可以打出任何牌
- 每次游玩的时间小于0.1秒
- 从添加新卡到确认结果的时间在36小时以下
学马仕的课程玩法可以看作是一个马尔可夫决策过程(MDP)。开发团队最初尝试使用蒙特卡罗树搜索(MCTS)方法,但发现执行一个包含9个回合的课程平均需要1416.2秒,效率过低。于是,他们转而采用深度强化学习方案,让AI通过反复试验来学习最佳游戏行为。
为了应对不断添加新卡带来的学习时间问题,开发团队使用了LLM中的文本嵌入技术来表达状态。这种方法可以无视产品画面样式的变化,并且具有无需额外学习即可引入新卡牌的优点。通过迁移学习,AI的学习时间从超过10天缩减到了10个小时的水准。
实际效果与意义
通过上述技术方案,学马仕项目组实现了显著的成果:
- 在游戏上线前可以模拟超过1亿套卡组
- 累计课程训练次数超过10亿次
- 课程AI能在0.1秒内完成一局游戏
- 卡组探索效率相比完全随机采样提高了约15%
这些成果不仅帮助开发团队发现了设计或测试时未注意到的细节,还有效防止了顶级玩家的牌组变得相似,避免了技能卡组合出现循环等问题。更重要的是,这套AI系统还能帮助检测游戏BUG,进一步提升了游戏品质。
总结与展望
《学园偶像大师》的案例充分展示了AI技术在游戏开发中的巨大价值。通过深度强化学习、迁移学习等先进技术,开发团队成功解决了卡牌游戏平衡性这一难题。这种AI辅助游戏开发的方式,不仅提高了研发效率,也优化了游戏素质,为玩家带来了更好的体验。
未来,随着AI技术的不断发展,我们有理由相信,它将在游戏设计、测试、优化等各个环节发挥更大的作用。从资源生成到玩法创新,从个性化推荐到反作弊机制,AI正在全方位地改变着游戏产业的面貌。《学园偶像大师》的成功经验,无疑为整个行业提供了一个值得借鉴的范例。