真·开放式游戏,谷歌造出首个无限人生模拟游戏Unbounded
真·开放式游戏,谷歌造出首个无限人生模拟游戏Unbounded
如果你是一位开放世界或角色扮演游戏的玩家,你一定梦想过一款无限自由的游戏。没有空气墙,没有剧情杀,也没有任何交互限制。现在,谷歌新开发的一个无限制(Unbounded)游戏已经为我们昭示了这一可能性。
游戏设计理念
Unbounded一作源自Jialu Li的推文,这是一个由AI生成的游戏世界,可以随着游戏的推进而无限延展和演进。游戏中的角色可以根据用户的要求进行定制,同时,这个游戏也不存在任何交互规则的限制。一切都是开放的,甚至你的想象力都无法限制它,就像《安德的游戏》中的心智游戏。
电影《安德的游戏》中的心智游戏画面
技术创新
谷歌和北卡罗来纳大学教堂山分校的研究团队在论文中探索了生成式无限视频游戏的可能性,提出了首个交互式生成式无限游戏Unbounded。该游戏的核心机制围绕角色模拟和开放式交互,玩家可以定义自己角色的外观和个性,并在游戏中探索环境、与物体互动并进行对话。
Unbounded具有以下主要功能:
- 角色个性化:玩家可以定义自己角色的外观和个性。
- 游戏环境生成:Unbounded会生成一个持久的世界供角色探索和互动。
- 开放式互动:玩家可以使用自然语言指令与角色互动,没有预定义的规则限制。
- 实时生成:游戏实现了接近一秒的刷新率,每个新场景的延迟约为一秒。
技术实现
为了实现这些功能,研究团队在语言模型和视觉生成方面都做出了一定的技术创新:
潜在一致性模型(LCM):通过使用LCM,Unbounded实现了实时文本到图像(T2I)生成,这对于提供刷新率接近一秒的交互式游戏体验至关重要。
区域IP适配器:研究团队提出了一种新颖的区域IP适配器,以便按照文本提示在预定义环境中始终如一地植入角色。这种方法引入了双重调节和动态区域注入机制,以在生成的图像中同时表示角色和环境。
语言模型游戏引擎:研究团队构建了一个角色生活模拟游戏,包含两个LLM智能体,用于处理开放式交互和集成游戏机制。
实验结果
实验中,研究团队使用GPT-4o收集了一个由5,000个(角色图像、环境描述、文本提示)三元组组成的评估数据集。实验结果表明,带有块丢失的区域IP适配器在保持环境一致性和角色一致性方面始终优于以前的方法,同时在保持语义对齐方面也达到了可比的性能。
此外,研究团队还展示了蒸馏专业化LLM的有效性。实验表明,针对游戏世界和角色动作模拟任务而蒸馏更强大的LLM是有效的,且使用更大的数据集在各个方面都更优。
尽管目前Unbounded整体还比较简单,更多的还是进行一种概念验证,但其隐含的可能性却足以引起人们的无限遐想。这项研究为未来游戏产业的发展提供了新的方向,让我们看到了无限可能的未来游戏世界。
