BBC研究:四大AI聊天机器人超半数新闻摘要存重大问题
BBC研究:四大AI聊天机器人超半数新闻摘要存重大问题
BBC最新研究揭示,四大主流AI聊天机器人在处理新闻内容时存在显著不准确性。研究发现,超过半数的AI生成答案存在重大问题,其中19%的引用BBC内容的回答包含事实错误。
最近,BBC进行的一项研究显示,四个著名的人工智能(AI)聊天机器人在报道新闻故事时存在误导现象。研究聚焦于OpenAI的ChatGPT、微软的Copilot、谷歌的Gemini和Perplexity AI,它们被提供了BBC网站的内容,并被要求回答与新闻相关的问题。
研究结果显示,这些聊天机器人生成的回答包含“显著的不准确性”和误导性。BBC新闻与时事首席执行官黛博拉·特纳斯在一篇博客中指出,虽然人工智能带来了“无尽的机会”,但开发这些技术的公司却是在“玩火”。她对AI生成标题的潜在危害表示担忧,质疑这种扭曲会在多长时间内导致严重的现实后果。
负责这些聊天机器人的科技公司已被联系以获取他们的回应。研究涉及要求ChatGPT、Copilot、Gemini和Perplexity对100篇新闻文章进行总结,并评估它们的答案。具有相关领域专业知识的记者对AI系统的回答质量进行了评估。
结果显示,51%的AI生成答案存在重大问题。此外,19%的引用BBC内容的回答包含事实错误,内容从错误陈述到错误的数字和日期不等。
在她的博客中,特纳斯强调了BBC与AI技术提供商之间需要合作应对这些挑战。她敦促科技公司“收回”其AI生成的新闻摘要,类似于苹果在收到BBC关于Apple Intelligence错误表述新闻的投诉后所采取的行动。
BBC强调的几个具体不准确之处包括:
- Gemini错误地表示NHS不推荐使用电子烟作为戒烟方法。
- ChatGPT和Copilot错误声称里希·苏纳克和尼古拉·斯特金仍在任,尽管他们已经辞职。
- Perplexity错误引用BBC新闻关于中东的言论,错误地将伊朗的反应描述为“克制”,同时将以色列的行动标记为“侵略性”。
总体来说,微软的Copilot和谷歌的Gemini相比于OpenAI的ChatGPT和由杰夫·贝索斯支持的Perplexity呈现出更显著的问题。传统上,BBC限制AI聊天机器人使用其内容,但在2024年12月的测试中允许其访问。
报告指出,除了事实不准确之外,这些聊天机器人通常难以区分意见和事实,倾向于进行编辑,并且经常缺乏关键背景。BBC生成AI项目主任皮特·阿切尔表示,出版商应该保持对其内容使用方式的控制,而AI公司必须展示其系统如何处理新闻及其生成的错误规模的透明度。