为何焦点已从 AI 代理转向AI辅助人类工作模式

创作时间:

作者:

@小白创作中心

为何焦点已从 AI 代理转向AI辅助人类工作模式

引用

来源

https://juejin.cn/post/7469790099195609139

随着AI技术的快速发展，行业焦点正从AI代理转向AI辅助人类工作模式。这种转变反映了企业越来越注重如何通过利用AI来实际解决问题，应对快速变化的技术和不断增长的业务挑战。

AI代理的局限性

像Salesforce和Service这样的公司曾大力转向AI代理，但AI代理的严峻现实是，技术在准确性方面尚未达到应有的水平。如果撇开营销炒作以及AI代理的优秀原型和演示来看，它们的准确性尚不足以用于生产环境。

Claude AI代理计算机接口（ACI）的性能仅为人类表现的14%。下方的图表来自TheAgentFactory，展示了AI代理在成本、步骤和成功率方面的位置。请注意，成功率大约为20%。

这些数据是当前情况的真实写照。随着最近OpenAI Operator的发布，计算机使用和Web浏览的准确率达到了30%至50%，但仍然低于人类70%以上的能力。此外，还有有趣的研究表明，具备Web浏览能力的AI代理容易受到恶意弹出窗口的攻击。

AI代理想要像人类一样执行任务有两条路径：一是通过Web浏览器（如Webvoyager、OpenAI Operator等）；二是通过操作系统的完整GUI（如Anthropic）。这些方法将GUI作为AI代理的API进行使用。最初的方法是使用单独的API，但由于开发每个API集成的开销过大，这种方式并不现实。而且，许多商业应用根本没有API可用。

代理式工作流的优势

所有人都同意现代知识型工作已经崩坏，各种报告给出了不同的数据。其中一份报告指出，员工有30%的时间花在搜索信息上。知识型工作者在回答复杂问题时面临挑战，他们需要从不同的文档中综合信息。

代理式工作流（如下图所示）能够进行推理，并将复杂任务分解为更简单的子任务，再将这些任务以链式结构串联执行。

通过执行这些任务序列，可以引入可观测性、可检查性和可发现性等元素。数据的综合将变得越来越重要。代理式工作流就是一个例子，它能够为知识型工作者综合工作数据和资源，提供一个统一的答案。

语言模型提供商正在摆脱仅提供模型的局限，而是向用户体验扩展。ChatGPT的深度研究（Deep Research）并不是一个新模型，而是在ChatGPT内部新增的代理式能力，能够在互联网上进行多步研究，以解决复杂任务。它在几十分钟内完成的任务，通常需要人类花费数小时。这也是一个很好的例子，展示了如何综合不同来源的数据来回答用户的问题。

我觉得这是LlamaIndex提出的“代理式RAG”理念，即在某个特定时间点，为“唯一的受众”综合数据将变得至关重要。在未来几个月，个人代理式工作流、信息综合，以及所谓的桌面编排（desktop orchestration）将成为重点关注方向。

推理与问题解决

现代AI模型正日益将推理作为核心功能，使其能够通过将复杂问题拆解为可管理的部分来解决问题。这一转变基于一种创新方法，即将问题分解为更小的子集，使模型能够系统地处理每个部分。通过将推理视为内部机制，这些模型能够模拟人类的思维过程，增强其提供准确、细致响应的能力。这种分解策略不仅提高了问题解决的效率，还增强了对推理过程的透明度。结果是，用户可以获得更具可解释性的输出，缩小了高级计算与可理解决策之间的差距。

最初，用户需要在提示词中加入推理特性，指导模型如何进行推理，并拆解复杂或复合任务。同时，通过少样本示例（few-shot approach）来引导模型模仿。

总结

组织必须将关注点从固定在某些特定工具或趋势上转移——例如，曾自称为RAG公司、提示工程（Prompt Engineering）游乐场等，而应优先解决现实世界的商业挑战。世界正以前所未有的速度向前发展，几乎每天都有新技术涌现，每种技术都宣称能够颠覆行业。但真正衡量创新的标准，不是掌握最新技术，而是如何应用这些进步来创造实际价值。无论是改善客户体验、优化运营，还是解决社会需求，核心问题始终是：我们如何利用技术提供有意义的解决方案？通过这种思维方式，企业能够让自己具备面向未来的能力，并确保在不断变化的浪潮中保持竞争力。

热门推荐

Excel数据分析功能激活与使用指南