资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

吴恩达深度剖析：AI Agent工作流的演进与前景

创作时间:

作者:

@小白创作中心

吴恩达深度剖析：AI Agent工作流的演进与前景

引用

51CTO

https://www.51cto.com/aigc/420.html

AI Agent作为具备感知环境、做出决策和执行动作能力的智能实体，正在成为人工智能领域的关键发展动向。随着大型语言模型（LLM）技术的持续进步，AI Agent的潜力正被逐步揭示，它们不仅能够完成基于指令的任务，还能表现出更高水平的自主性和主动性。

在最近的红杉AI Ascent 2024活动中，人工智能领域的杰出人物吴恩达教授发表了一场关于AI Agent的富有洞见的演讲。他深入探讨了AI Agent的最新发展趋势和设计模式，为参与者提供了关于人工智能未来方向的深入理解。

AI Agent工作流的效果

吴恩达教授在演讲中着重指出，AI Agent正在引领工作流程的革新。与传统的工作流程不同，AI Agent通过迭代和对话式的模式工作，不再是简单的指令执行者，而是能够进行自我反思、规划和修正的参与者。

在传统的工作流程中，用户向AI Agent模型输入指令，模型生成回答，这种方式类似于要求人类专家连续不断地完成任务，没有提供反思和修正的空间。

相对而言，AI Agent的代理工作流是一个动态的、迭代的过程。AI Agent首先接收一个大致的任务，然后制定工作计划，执行任务，并在每一步中进行自我评估和修正。

这种工作流程类似于人类在写作、编程或其他创造性任务中的思考过程，允许AI Agent通过不断的迭代来提升工作成果的质量。例如，AI Agent可能会先创建一个草稿，然后审查和修改，这个过程可能会重复多次，直到达到满意的结果。

吴恩达教授通过案例研究展示了AI Agent代理工作流在编程任务中的实际效果。使用代理工作流的AI Agent能够生成更高质量的代码，并在遇到错误时自我修正，这种工作流不仅提升了代码的准确性，还减少了人为干预的需求。

吴恩达教授团队分析了一个叫做"人工评估基准测试"的编码基准数据，它包含诸如"给定一个非空整数列表，返回所有偶数位置元素的和"之类的编码问题。现有的做法是使用零样本提示，即直接让人工智能编写代码并运行，但没有人是这样编码的。

研究发现，GPT-3.5使用零样本提示时只有48%的正确率，GPT-4提高到了67%。但如果在GPT-3.5上使用一个代理工作流程，它的表现实际上比GPT-4还要好。如果在GPT-4上使用代理工作流程，它的表现也非常出色。这意味着采用代理工作流程对于构建应用程序至关重要。

四种AI Agent设计模式

吴恩达教授还提到了AI Agent的四种关键设计模式，它们是实现其高效执行复杂任务的基础。这些模式包括反思（Reflection）、工具使用（Tool Use）、规划（Planning）和多智能体协作（Multiagent Collaboration），共同构成了AI Agent的能力框架。

1. 反思

反思（Reflection）允许AI Agent在完成任务后，能够对自身的输出进行再次审视和评估。在这种模式下，AI Agent不仅仅是执行任务，而是能够像人类专家一样，对自己的工作进行批判性思考。

例如，AI Agent可能会生成一段代码，然后根据预设的标准或反馈，自我检查代码的正确性、效率和结构，并提出可能的改进措施。这种自我监督和修正的能力，使得AI Agent在执行任务时能够不断提高准确性和效率。

2. 工具使用

工具使用（Tool Use）赋予AI Agent使用外部工具和资源的能力，以此来扩展其功能和提高生产效率。

这种模式下，AI Agent可以搜索网页、生成和运行代码、分析数据等，利用各种工具来收集信息、执行操作。

例如，AI Agent可能会使用图像处理工具来分析和处理图像数据，或者调用API来获取和整合外部信息。这样的能力使得AI Agent不再局限于其内置的知识库，而是能够与外部系统交互，从而更好地适应多变的任务需求。

3. 规划

规划（Planning）强调AI Agent在面对复杂任务时，能够进行系统性的规划和步骤分解。AI Agent不仅能够理解任务的整体目标，还能够制定出详细的行动计划，并按照计划逐步推进任务的完成。

这种模式下，AI Agent能够展现出类似于人类的前瞻性和策略性思维。例如，AI Agent可能会在进行项目管理时，先确定项目的主要里程碑，然后为每个里程碑制定具体的执行步骤和时间表，确保项目能够有序进行。

4. 多智能体协作

多智能体协作（Multiagent Collaboration）突出了多个AI Agent之间的合作和协调。在这种模式下，每个AI Agent都可以扮演特定的角色，并与其他AI Agent共同协作以完成复杂的任务。

这种合作可以模拟真实世界中的团队工作流程，通过代理间的互补和协同作用，提高整体的执行效率和创新能力。

例如，在一个开源软件开发项目中，一个AI Agent可能负责编写代码，而另一个AI Agent则负责代码审查和测试，通过这样的分工合作，共同推动项目的成功完成。

这些模式的结合使用，不仅提升了AI Agent在单个任务中的执行能力，还为其在更广泛的应用场景中进行协作和创新提供了可能。随着这些模式的进一步发展和完善，AI Agent将在未来的工作流程中发挥更加关键的作用，推动各行各业向智能化转型。

AI Agent的代理工作流在多个行业中展现出其实际应用的巨大潜力。吴恩达教授提到了这些智能体在编程、研究和多模态任务处理等领域的应用。

在演讲中，吴恩达教授采用了"Agentic Reasoning"作为主题，这一概念可以翻译为"代理性推理"。它指的是AI Agent在执行任务时所采用的一种推理方式，涉及自主性、目标导向和问题解决的能力。

代理性推理强调AI Agent不仅仅是对输入做出反应，而是能够主动地进行思考、规划和决策，以实现特定的目标或应对复杂的问题。这种推理方式使得AI Agent更加类似于一个自主行动的智能体，能够在多变的环境中灵活地执行任务。由此可见，AI Agent的下一步发展或许才是真正意义上的智能体。