喜剧演员实验用AI写笑话:结果很失败,反而凸显喜剧的伟大之处
喜剧演员实验用AI写笑话:结果很失败,反而凸显喜剧的伟大之处
近年来,台湾喜剧界因一些争议性事件而受到关注,人们开始思考"什么是好喜剧"、"喜剧是否应该冒犯他人"等问题。在生成式AI迅速发展的今天,如果让语言模型来创作笑话,结果会如何呢?
一项于五月底发布的研究给出了答案:你将得到一些不够好笑且较为温和的笑话——因为AI会直接将可能引起争议的人物或话题"过滤"掉。
这项研究由Google DeepMind团队进行,标题颇具吸引力:"当机器人走进酒吧:语言模型能否作为喜剧的创意工具?评估大型语言模型与喜剧演员的幽默契合度"。研究邀请了二十位喜剧演员参与在爱丁堡艺穗节(Edinburgh Festival Fringe)现场及线上举行的为期三小时的"AI☓喜剧工作坊"。
参与者使用了包括ChatGPT-3.5、ChatGPT-4和Google Bard(即现在的Gemini)在内的语言模型,来协助他们撰写45分钟的喜剧表演素材。或许是由于Google DeepMind旗下的Google Bard也参与其中,研究中并未特别比较不同语言模型之间的差异。
看到论文标题,我脑中浮现的画面。(来源:Ideogram协作)
随后,研究团队让参与者填写了一份创意支援指数(Creativity Support Index)问卷,评估他们使用AI创作喜剧材料时的体验,并分组讨论使用AI的动机、过程、伦理考量等。
下图是参与者的反馈,可以看出只有"享受与AI共笔"是正面的,而"感到拥有素材所有权"则持中立态度。其他如"AI好用程度"、"惊喜度"和"合作顺 利度"都受到负面评价,尤其是后两项,显示参与者并不以AI创作的素材为傲,也不认为它们具有独特性。
(来源:arxiv.org)
AI的安全限制反而加强偏见?
研究的具体结论是什么?根据喜剧演员实际与AI协作、自我评估与分享,得出的论点是:尽管语言模型能快速生成内容与架构,但品质低落,就像"上个世纪的无聊笑话,但稍微少了一些种族歧视。"
参与者认为,语言模型的失败之处主要在三个方面:
一、审查和安全过滤的限制
喜剧段子经常游走在冒犯与反讽之间,因此喜剧表演者需要不断修改,拿捏尺度,但语言模型的预设审查机制提前干预了这个过程。我很喜欢其中一位参与者的总结:"创作,就是一个经历'这些材料不够好、不 对或冒犯边缘族群,而我需要使这些变得可接受'的阶段。但我认为AI在你有机会探索之前就已经开始这样做了。"这一点在涉及性暗示、黑色幽默和冒犯性笑话时,更为明显。
二、少数族群身份的边缘化
不少参与者指出,语言模型难以生成反映少数族群视角和身份的内容,并且在涉及这些族群时会 出现很表面的调整,好"看起来"不冒犯人。例如有人提到,语言模型会去掉他段子里的"同志哏",好让笑话更普遍级。这让他感觉是语言模型在决定什么是"政治正确",并剥夺了他表达身为少数群体的机会。也有人提到,语言模型拒绝生成以亚裔女性视角写的独白,却可以生成以白人男性视角写的独白。这些都让人反思:如果今天我是亚裔女性或女同志——例如黄艾莉(Ali Wong)或Hannah Gadsby——身份政治就是我喜剧成立的前提,但在语言模型的运作之下,一切便不成立。
三、AI的根本性限制,包括缺乏个人经验、表演情境意识、即兴能力、情感共鸣
参与者强调,好的喜剧来源于创作者的个人经验和生活片段,这赋予了喜剧独特的视角和情感深度,而AI缺乏这些。此外,掌握表演当下的情境和调整笑话的方式也是关键,例如,一个关于英国女王的笑话,在美国和英国观众中的效果会截然不同,但AI无法作出这种判断。参与者也指出,语言模型仅仅依赖数据来预测下一个最可能的文本,限制了它们创造出惊喜的能力,"AI无法在笑话方面冒任何风险",所以只能给出安全但无聊的笑话。
这份研究最有趣的点,大概是语言模型的政治正确防线,反而限缩了少数族群展现自我的空间。科技巨头担心使用者用它们的AI生成歧视内容,便直接把少数族群排除在外(也有可能是训练数据中本来就缺乏少数族群样本),却忽略了这些人也常会开自己玩笑,藉此翻转歧视或反讽主流价值的可能——自嘲,正是喜剧表演常见的手法。这份研究透过AI协作产生喜剧素材,让科技巨头政治正确的表面功夫露出了破绽。
想让AI理解喜剧,就要先让AI尝尝痛苦?
不过这也让人好奇,未来AI更聪明的话,有没有可能扳回一城呢?或许可从更"理解"喜剧表演者、少数族群经验,从而辅助人类梳理相关生命故事开始。这让我想到一部以单口喜剧为题材的影集——《天后与草莓》(Hacks)提出的思考:喜剧作为一种提炼痛苦的艺术。
影集里,单口喜剧传奇天后黛博拉(Deborah),十儿年前经历前夫与妹妹私通背叛,一气之下烧了前夫家,闹上社会新闻,前夫把她告上法庭。她发现观 众很吃这个笑话,于是一讲再讲,也终于成为老哏(这也是剧名Hacks的由来,在美国喜剧圈,这词专指那些过气又重复旧段子的演员)。
然而黛博拉并未真正消化这段过往,甚至透过这个老哏自我催眠,拒绝跟妹妹联络,也从未原谅前夫。直到黛博拉遇到Z世代草莓、喜剧写手艾娃(Ava),跟她倾诉内心的痛苦与遗感。艾娃建议她把这段经历放到段子里,认为真诚的痛苦可以赋予这个老哏动人的力量;黛博拉却怀疑有人会对她——一个年过七十的女性——的痛苦有兴趣。
《天后与草莓》出色的处理女性情谊、喜剧艺术,刚刚播完第三季,大推。(来源:HBO Max)
黛博拉照做了吗?暂且卖个关子,欢迎大家去追这部影集。回到这份研究,虽然验证了AI创作喜剧的现阶段不足,但如同影集里的这个段落,反而提醒了我们:好的喜剧,往往来自心灵角落那些被我们扫成堆、不愿面对的痛苦。
至于要让AI好笑,明白喜剧的苦中作乐,是不是代表人类要虐待AI了呢?听起来很恐怖,还是先从放《天后与草莓》给它们看开始吧(?)