AI在内容创作中扮演何种角色?科学家发现AI已能带来八类贡献
AI在内容创作中扮演何种角色?科学家发现AI已能带来八类贡献
AI在内容创作中扮演何种角色?科学家发现AI已能带来八类贡献。
AI划重点:全文约3985字,阅读需12分钟
- 美国宾州州立大学博士生吕尧等合作者开展了一项关于生成式AI在内容创作中的应用研究。
- 研究发现,内容创作者们正在越来越多地尝试将生成式AI工具融入创作实践,如大型语言模型和文本到图像/视频的生成模型。
- 通过分析YouTube视频素材,研究人员总结出六大类AI工具类型和八种主要的AI贡献行为。
- 然而,生成式AI在内容创作领域的应用也面临诸多挑战,如版权纠纷、知识产权争议等。
- 未来研究将继续扩展研究范围、追踪技术发展、挖掘创作者体验、制定设计原则和探讨伦理与政策。
图 | 吕尧(来源:吕尧)
这项研究的缘起可以追溯到近年来生成式人工智能(Generative AI)技术的突飞猛进。作为AI发展的一个全新赛道,生成式AI展露出令人惊艳的创造能力,能够根据简单的提示或指令,生成逼真的图像、视频、文本、音频等丰富多媒体内容。
其中,大型语言模型(如GPT-3)和文本到图像/视频的生成模型(如DALL-E、Stable Diffusion)无疑是最耀眼的“明星”。它们突破了人类认知的极限,让AI系统也能拥有“想象力”,催生出超乎想象的创意作品。
与此同时,内容创作者群体(例如YouTuber)正在极力拥抱并驾驭这些生成式AI工具,将其融入到自身的创作实践中。借助AI的协助,人们可以极大提升创作效率,甚至超越自身的能力边界,生成出高质量、且与众不同的内容作品。
详细来说,本次研究始于2023年的一次同行交流。当时,吕尧和本次论文的第二作者He Zhang、第三作者Jie Cai、以及美国克拉克大学的Shuo Niu博士参加了人机交互与普适计算大会(CSCW,ACM Conference on Computer Supported Cooperative Work and Social Computing)。
交流之中,Shuo Niu提到了一个新兴现象:内容创作者们正在越来越多地尝试将生成式AI工具融入创作实践之中。但是,具体是怎样的尝试?效果如何?存在什么机遇和挑战?在这次交谈中,他们都认为这是一个潜力很大的课题,并且表达了对这个课题的兴趣。
基于这样的疑问,他们开始查阅大量文献,搜集各方观点和一手素材。通过几个月的持续关注,他们逐步确立了本次研究的核心主题:对内容创作中的生成式AI应用进行系统性探索。
为全面了解内容创作者运用生成式AI的实践,他们设计了搜索策略,从视频平台YouTube上下载了大量相关视频素材。这其中也遇到了一些技术挑战,比如如何过滤无关视频、如何获取更多元化的示例等,通过多次调整策略之后他们才逐步攻克这些难题。
经过初步筛选,他们最终锁定68个高质量分析样本,覆盖了多个不同创作领域。这些视频展示了创作者与生成式AI工具的实际互动过程,对于接下来的数据分析至关重要。
针对这批宝贵的一手素材,他们采用开放式编码以及亲和图分组等经典的定性研究方法,对视频数据进行了细致分析。期间,他们反复观看理解每一个视频,识别并标注出与研究问题相关的所有要素。
过程中最大的挑战是:如何准确理解和命名新名词、新事物,因为生成式AI应用是一个前沿领域,缺乏成熟理论框架和术语体系。由于生成式AI的应用实在太过新颖和前沿,他们在对视频素材进行分类归纳时,常常会遇到概念界定的分歧和争议。
有些AI工具比如Synthesia既可以生成图像又可以生成视频,那它到底应该被归为“图像处理工具”还是“视频处理工具”?针对这一问题,小组成员在会议室里展开过激烈的辩论。有人认为应该根据工具的最终输出形态来定义分类;但也有人提出这样过于片面,忽视了工具在创作流程中所扮演的角色和贡献。
最终,通过多轮讨论碰撞,他们决定从工具在创作过程中的实际“行为”出发,对每个视频素材中呈现的AI用途进行编码,再据此进行分类和命名。这一看似简单的方法论争议,实则体现了他们对AI创作实践本质的深入思考。
另一个令吕尧印象深刻的讨论焦点,则是关于“AI生成内容”在当下是否真正属于“创作”范畴的哲学命题。由于AI只是根据提示和规则运算产生结果,那么是否可以用“创造”来形容?这种质疑不仅引发了他们对智人与智能界限的反思,也体现了生成式AI给传统“创作”概念带来的全新思考维度。
虽然未能给出一个终极定论,但他们每个人对于这一哲学命题都有了自己独到的见解。而在完成初步编码之后,他们通过集中讨论、归纳总结,最终从海量原始数据中提炼出一系列有价值的发现,并将它们逐一对应到所设置的研究问题之中。
比如在“内容创作者使用了哪些AI工具”这一问题上,他们总结出了语言模型、图像处理器、视频处理器等六大工具类型,并详细列举出每类型下的具体工具实例。而在“AI工具在创作中扮演了何种角色”的问题上,他们则从视频中总结归纳出了诸如“生成”“升级”“建议”等八种主要的AI贡献行为。
最终,相关论文以《对YouTube用户在内容创作中使用生成式AI的初步探讨》(A Preliminary Exploration of YouTubers’ Use of Generative-AI in Content Creation)为题发在人机交互顶会ACM SIGCHI CHI Conference on Human Factors in Computing Systems上[1]。
图 | 相关论文(来源:ACM SIGCHI CHI Conference on Human Factors in Computing Systems)
如果本次成果能够得到业界的关注和认可,它可以为相关领域带来一些积极的价值。预计有望推动以下几个方面的进展:
首先,优化内容创作工具。根据课题组对创作实践的细致分析,生成式AI工具的开发者可以更精准地把握用户需求,开发出符合创作者习惯的一体化解决方案。例如,将视觉生成、音频生成、视频编辑等多种AI能力无缝集成到同一个创作平台,从而简化创作流程,提升工作效率。
此外,通过本次研究该团队对生成式AI在创作中的具体角色和贡献也有了更深入的认知。这可以为优化工具的人机交互界面提供依据,进一步提升人与AI的协作效能。比如,可以在工具界面上增加更多反馈和修正的自由度、以及增加更智能的提示机制,帮助创作者高效地调整和控制AI输出结果。
其次,推进人工智能教育。生成式AI正在悄然改变内容创作的游戏规则。相较于传统的人力创作,AI辅助的创作模式无疑效率更高、门槛更低。未来,如何高效利用这些新兴工具,保证自身在激烈的人机竞争中不被边缘化,将是内容创作者亟待解决的现实课题。而本次研究可以为设计AI教育培训课程提供参考,帮助创作者获得必要的AI素养。包括高效调用和编排各种AI能力的技巧、评判AI输出质量的标准、创作中的人机分工模式等,从而顺利融入人机协作的新常态。
再次,完善内容审核和法律政策。随着生成式AI快速渗透内容创作的各个环节,审核AI生成内容质量的需求也将日益迫切。本次针对当前内容创作中生成式AI的具体使用场景和产出形态的研究,可以为制定相关审核标准、识别AI生成内容的方法论提供依据。从本次研究的结论来看,在视频创作领域YouTube创作者普遍利用AI工具生成虚拟人物形象,进而用于录制“人物”视频。那么在审核过程中,就可以基于人物动作、语音等细节特征,来鉴别视频中的人物是否为真人。
另一方面,大规模AI生成内容的涌入,也对现有的知识产权法律制度提出了新的挑战。谁拥有AI生成作品的版权?创作者的贡献是否足够获得版权?算法本身能否享有某种权利?诸如此类的法律争议将暴露出越来越多的空白点,亟待通过司法判例和法律法规的补充来规范和明确。而本次研究或可为厘清版权纷争、探讨相关法律责任提供一些实证支撑,为制定科学合理的AI内容治理政策贡献一份力量。
最后,催生新型商业模式。生成式AI无疑是一种生产力,它在赋能内容创作者的同时,也必将催生出新的商业模式。依托AI的力量,大批新生创作者将能更加便利地加入内容创作的大潮,从而加剧这一领域的“去中心化”趋势。在这种趋势下,创新的盈利模式或将涌现出来。可以预见:为了满足AI辅助创作过程的需求,将可能衍生出创作素材的交易市场、辅助创作服务的供应链、为生成内容“加成”并售卖的中间产品等新兴商业形态。例如,有一位YouTuber就曾展示如何基于AI素材模板,二次编辑生成出新颖有趣的视频内容,并通过售卖这些内容产生收益。
而本次研究或许可以为这种“去中介”的新型创业累积理论基础,为寻找新的盈利模式指明方向。
(来源:ACM SIGCHI CHI Conference on Human Factors in Computing Systems)
此外,吕尧补充称:“我想再次强调生成式AI对内容创作领域带来的深远影响。这种影响不仅体现在创作工具和流程的变革之上,也将逐步渗透到内容生态、商业模式、法律政策等多个层面。”
生成式AI为内容创作者提供了全新的“智能助理”,有望解放创作者的生产力,催生出更多富有创意的作品。与此同时,AI生成内容的泛滥也可能对平台的内容质量和知识产权造成一定冲击。如何在创新与管控之间寻求平衡,妥善利用AI优势,规避其潜在风险,是一个亟待解决的命题。
因此,吕尧希望本次研究能够引发同行对这一话题的更多思考和讨论。
(来源:ACM SIGCHI CHI Conference on Human Factors in Computing Systems)
与此同时,生成式人工智能及其在内容创作领域的应用正在日新月异地发展和演进,吕尧认为本次成果仅仅是勾勒出了一个万里长征的起点。未来,他们仍将紧密跟踪这个前沿热点,努力在以下方向取得新突破:
其一,扩展研究范围。目前,他们仅仅分析了YouTube视频,但生成式AI的使用远不止如此。因此,其计划将研究范围扩展到其他主流内容平台,如TikTok、Instagram、X等,以便更全面地了解内容创作者的实践动向。
其二,追踪技术发展。第二代大型语言模型、视觉问答模型等AI创新层出不穷,必将进一步改变内容创作的游戏规则。所以,需要及时跟进这些发展动态,分析其对创作实践和内容生态的影响。
其三,挖掘创作者体验。目前,他们主要关注的是创作产出的层面,但对内容创作者的实际体验和感受还缺乏深入了解。未来,吕尧等人计划开展定性研究,通过访谈等方式采集第一手数据,全方位把握用户在使用生成式AI时的切身感受。
其四,制定设计原则。在理解创作实践的基础上,他们希望能总结出一些设计原则和最佳实践,为工具开发者和内容平台提供指引,让AI辅助创作工具更好地契合使用场景需求。
其五,探讨伦理与政策。生成式AI在推动内容创新的同时,也可能带来诸如版权纠纷、知识产权争议等伦理法律问题。其也期望能够就此开展相关研究,为应对这些挑战献计献策。
参考资料:
1.Lyu, Y., Zhang, H., Niu, S., & Cai, J. (2024, May). A Preliminary Exploration of YouTubers' Use of Generative-AI in Content Creation. InExtended Abstracts of the CHI Conference on Human Factors in Computing Systems (pp. 1-7).