科学家用Oogiri游戏提高大模型创造力,能自动生成幽默段子和编写剧本
科学家用Oogiri游戏提高大模型创造力,能自动生成幽默段子和编写剧本
中山大学研究团队通过Oogiri游戏数据集提升大模型创造力,成功让AI自动生成幽默段子和编写剧本。该研究通过构建多模态、多语言的Oogiri-GO数据集,并设计选择题和排序题作为评估数据,有效量化了"灵光一闪"现象,相关成果已在国际计算机视觉与模式识别会议(CVPR)上发表。
尽管思维链(CoT,Chain-of-Thought)极大提升了大模型的逻辑推理能力,并让大模型能够逐步推导解决方案。但是,这种链式思维模式采取一步一步思考的方式,在面对需要创造性思维的问题时会显得力不从心。
在探索如何解决这一难题时,中山大学教授林倞团队联想到人类解决问题时常有的“灵光一闪”(LoT,Leap-of-Thought)现象,于是尝试从创造性思维着手,来提升大模型的创造力。
图 | 左起:林倞、黄中展、钟珊珊(来源:课题组)
基于此,在近期一项课题之中,他们研究了大模型的 LoT 能力,探索了提升大模型创造力的新方法。尤其探索了大模型的跳跃性联想能力和非传统推理思路能力,即如何让大模型超越逻辑链,实现更加灵活、更加创新的思考,以适应那些需要跳出常规思维框架的任务。
图 | 两种不同的思维示意图(来源:CVPR)
Oogiri 游戏起源于日本,通过提供各种多模态内容,能够提示玩家想出幽默的、有创意的反应,以达到令人惊讶的喜剧效果。
图 | Oogiri 游戏样例(来源:CVPR)
基于 Oogiri 的数据,他们也想探索如何让大模型生成幽默观点、进行跨领域联想、以及在没有直接线索的情况下提出新颖观点。即如何通过使用 Oogiri 这种传统幽默喜剧游戏,来搭建提高大模型创新能力的平台。
在收集 Oogiri 数据的过程中,他们发现 Oogiri 数据来源不统一、而且格式多样。于是,该团队综合使用光学字符识别、图片裁剪等方法,针对数据进行人工清洗和人工筛查。借此将 Oogiri 数据整理成统一的问答格式,从而构建出多模态、多语言的 Oogiri-GO 数据集,并基于此来探索大模型的创造力。
但是,“灵光一闪”这件事情很难得到量化。因此,如何解决大模型创造力量化的问题,成为他们验证本次方法的关键。后来,课题组基于 Oogiri-GO 设计了选择题和排序题,并以此作为评估数据,让大模型可以像做卷子那样完成评测。
图 | 本次方法生成的样例(来源:CVPR)
日前,相关论文以《让我们走出框框思考:用创造性幽默一代探索大语言模型中的思维跃迁》(Let’s Think Outside the Box:Exploring Leap-of-Thought in Large Language Models with Creative Humor Generation)为题发在国际计算机视觉与模式识别会议(CVPR,Conference on Computer Vision and Pattern Recognition)。
中山大学硕士生钟珊珊、中山大学博士生黄中展是共同一作,中山大学教授、IEEE Fellow 林倞担任共同通讯作者。
图 | 相关论文(来源:CVPR)
总的来说,本次成果可以帮助人们开发更加智能、更加有趣的互动娱乐内容,比如自动生成幽默段子、编写创意剧本等。当然,本次方法并不仅仅局限于幽默生成,还能用于研究大模型的创新思考能力。
课题组表示:“Oogiri 只是我们的研究平台,而我们的研究核心在于提升大模型的创造力。”他们希望 LoT 思维模式能让大模型像人类一样具备跳跃式思考的能力。
下一步,他们计划继续针对大模型创造力开展研究,探索更多可以激发和衡量创造性思维的场景和任务。并打算将本次框架应用于更广泛的领域,比如用于艺术创作和科学假设生成等,以便进一步拓展 AI 的能力。同时,他们也将努力让大模型的创造性输出变得更加可控、更加人性化,以确保该技术是安全且负责任的。