问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

为何焦点已从 AI 代理转向AI辅助人类工作模式

创作时间:
作者:
@小白创作中心

为何焦点已从 AI 代理转向AI辅助人类工作模式

引用
1
来源
1.
https://juejin.cn/post/7469790099195609139

随着AI技术的快速发展,行业焦点正从AI代理转向AI辅助人类工作模式。这种转变反映了企业越来越注重如何通过利用AI来实际解决问题,应对快速变化的技术和不断增长的业务挑战。

AI代理的局限性

像Salesforce和Service这样的公司曾大力转向AI代理,但AI代理的严峻现实是,技术在准确性方面尚未达到应有的水平。如果撇开营销炒作以及AI代理的优秀原型和演示来看,它们的准确性尚不足以用于生产环境。

Claude AI代理计算机接口(ACI)的性能仅为人类表现的14%。下方的图表来自TheAgentFactory,展示了AI代理在成本、步骤和成功率方面的位置。请注意,成功率大约为20%。

这些数据是当前情况的真实写照。随着最近OpenAI Operator的发布,计算机使用和Web浏览的准确率达到了30%至50%,但仍然低于人类70%以上的能力。此外,还有有趣的研究表明,具备Web浏览能力的AI代理容易受到恶意弹出窗口的攻击。

AI代理想要像人类一样执行任务有两条路径:一是通过Web浏览器(如Webvoyager、OpenAI Operator等);二是通过操作系统的完整GUI(如Anthropic)。这些方法将GUI作为AI代理的API进行使用。最初的方法是使用单独的API,但由于开发每个API集成的开销过大,这种方式并不现实。而且,许多商业应用根本没有API可用。

代理式工作流的优势

所有人都同意现代知识型工作已经崩坏,各种报告给出了不同的数据。其中一份报告指出,员工有30%的时间花在搜索信息上。知识型工作者在回答复杂问题时面临挑战,他们需要从不同的文档中综合信息。

代理式工作流(如下图所示)能够进行推理,并将复杂任务分解为更简单的子任务,再将这些任务以链式结构串联执行。

通过执行这些任务序列,可以引入可观测性、可检查性和可发现性等元素。数据的综合将变得越来越重要。代理式工作流就是一个例子,它能够为知识型工作者综合工作数据和资源,提供一个统一的答案。

语言模型提供商正在摆脱仅提供模型的局限,而是向用户体验扩展。ChatGPT的深度研究(Deep Research)并不是一个新模型,而是在ChatGPT内部新增的代理式能力,能够在互联网上进行多步研究,以解决复杂任务。它在几十分钟内完成的任务,通常需要人类花费数小时。这也是一个很好的例子,展示了如何综合不同来源的数据来回答用户的问题。

我觉得这是LlamaIndex提出的“代理式RAG”理念,即在某个特定时间点,为“唯一的受众”综合数据将变得至关重要。在未来几个月,个人代理式工作流、信息综合,以及所谓的桌面编排(desktop orchestration)将成为重点关注方向。

推理与问题解决

现代AI模型正日益将推理作为核心功能,使其能够通过将复杂问题拆解为可管理的部分来解决问题。这一转变基于一种创新方法,即将问题分解为更小的子集,使模型能够系统地处理每个部分。通过将推理视为内部机制,这些模型能够模拟人类的思维过程,增强其提供准确、细致响应的能力。这种分解策略不仅提高了问题解决的效率,还增强了对推理过程的透明度。结果是,用户可以获得更具可解释性的输出,缩小了高级计算与可理解决策之间的差距。

最初,用户需要在提示词中加入推理特性,指导模型如何进行推理,并拆解复杂或复合任务。同时,通过少样本示例(few-shot approach)来引导模型模仿。

总结

组织必须将关注点从固定在某些特定工具或趋势上转移——例如,曾自称为RAG公司、提示工程(Prompt Engineering)游乐场等,而应优先解决现实世界的商业挑战。世界正以前所未有的速度向前发展,几乎每天都有新技术涌现,每种技术都宣称能够颠覆行业。但真正衡量创新的标准,不是掌握最新技术,而是如何应用这些进步来创造实际价值。无论是改善客户体验、优化运营,还是解决社会需求,核心问题始终是:我们如何利用技术提供有意义的解决方案?通过这种思维方式,企业能够让自己具备面向未来的能力,并确保在不断变化的浪潮中保持竞争力。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号