问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

BBC研究:四大AI聊天机器人超半数新闻摘要存重大问题

创作时间:
作者:
@小白创作中心

BBC研究:四大AI聊天机器人超半数新闻摘要存重大问题

引用
1
来源
1.
https://neuron.expert/news/ai-chatbots-unable-to-accurately-summarise-news-bbc-finds/11028/zh/

BBC最新研究揭示,四大主流AI聊天机器人在处理新闻内容时存在显著不准确性。研究发现,超过半数的AI生成答案存在重大问题,其中19%的引用BBC内容的回答包含事实错误。

最近,BBC进行的一项研究显示,四个著名的人工智能(AI)聊天机器人在报道新闻故事时存在误导现象。研究聚焦于OpenAI的ChatGPT、微软的Copilot、谷歌的Gemini和Perplexity AI,它们被提供了BBC网站的内容,并被要求回答与新闻相关的问题。

研究结果显示,这些聊天机器人生成的回答包含“显著的不准确性”和误导性。BBC新闻与时事首席执行官黛博拉·特纳斯在一篇博客中指出,虽然人工智能带来了“无尽的机会”,但开发这些技术的公司却是在“玩火”。她对AI生成标题的潜在危害表示担忧,质疑这种扭曲会在多长时间内导致严重的现实后果。

负责这些聊天机器人的科技公司已被联系以获取他们的回应。研究涉及要求ChatGPT、Copilot、Gemini和Perplexity对100篇新闻文章进行总结,并评估它们的答案。具有相关领域专业知识的记者对AI系统的回答质量进行了评估。

结果显示,51%的AI生成答案存在重大问题。此外,19%的引用BBC内容的回答包含事实错误,内容从错误陈述到错误的数字和日期不等。

在她的博客中,特纳斯强调了BBC与AI技术提供商之间需要合作应对这些挑战。她敦促科技公司“收回”其AI生成的新闻摘要,类似于苹果在收到BBC关于Apple Intelligence错误表述新闻的投诉后所采取的行动。

BBC强调的几个具体不准确之处包括:

  • Gemini错误地表示NHS不推荐使用电子烟作为戒烟方法。
  • ChatGPT和Copilot错误声称里希·苏纳克和尼古拉·斯特金仍在任,尽管他们已经辞职。
  • Perplexity错误引用BBC新闻关于中东的言论,错误地将伊朗的反应描述为“克制”,同时将以色列的行动标记为“侵略性”。

总体来说,微软的Copilot和谷歌的Gemini相比于OpenAI的ChatGPT和由杰夫·贝索斯支持的Perplexity呈现出更显著的问题。传统上,BBC限制AI聊天机器人使用其内容,但在2024年12月的测试中允许其访问。

报告指出,除了事实不准确之外,这些聊天机器人通常难以区分意见和事实,倾向于进行编辑,并且经常缺乏关键背景。BBC生成AI项目主任皮特·阿切尔表示,出版商应该保持对其内容使用方式的控制,而AI公司必须展示其系统如何处理新闻及其生成的错误规模的透明度。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号