吴恩达最新演讲:四种 Agent 设计范式详解
吴恩达最新演讲:四种 Agent 设计范式详解
吴恩达教授最近在红杉AI峰会上分享了他对Agent的最新见解。尽管一些媒体已经进行了相关报道,但为了确保内容的准确性和可读性,本文对演讲内容进行了重新整理和翻译,力求让不同背景的读者都能无障碍地理解。
传统Prompt与Agentic Workflow的对比
在使用ChatGPT等AI工具时,我们通常采用传统的Prompt方式:输入一个问题,得到一个答案。这类似于直接要求某人完成一篇文章的写作。相比之下,Agentic Workflow则更像是一种指导性的写作过程:先制定大纲,查找资料,撰写草稿,然后反复修改和完善。
图1:传统Prompt与Agentic Workflow的对比
HumanEval案例研究
吴恩达团队使用HumanEval数据集进行了一项案例研究,该数据集由OpenAI设计用于评估编程语言模型。研究发现,直接使用Zero-shot方式(不提供具体训练样本或标签提示)编写代码并运行,并不是一个明智的做法。
图2:HumanEval案例研究示例
研究结果表明:
- GPT3.5 + Zero-shot的正确率为48%
- GPT4 + Zero-shot的正确率为67%
- GPT3.5 + Agentic Workflow的效果甚至超过了GPT4
这充分说明了Agent在构建AI应用中的重要性。
Agent的四种设计范式
吴恩达将Agent的设计模式分为四类:Reflection、Tool Use、Planning和Multi-agent。其中,Reflection和Tool Use属于较为经典且已广泛应用的方式,而Planning和Multi-agent则展现出更大的潜力和前景。
Reflection(反思)
Reflection机制允许AI系统自我检查和迭代改进。例如,当AI生成一段代码后,会自动检查其正确性并提出修改建议。这种自我纠错的过程可以显著提高代码质量。
图3:Reflection机制示例
此外,还可以通过多Agent协作的方式进一步优化:一个Agent负责编写代码,另一个负责Debug。这种方式在很多场景中都表现出色。
图4:多Agent协作示例
Tool Use(工具使用)
通过调用外部插件,LLM的能力边界得到了极大拓展。常见的应用场景包括使用Copilot进行网络搜索,或在解决数理逻辑问题时调用代码插件。
Planning(规划)
Planning机制允许AI将复杂任务分解为多个子任务,并依次执行。例如,在生成特定图片时,AI会先提取参考图片的姿态特征,然后选择合适的模型生成目标图片,最后进行文字描述。
图5:Planning机制示例
Multi-agent(多智能体协作)
多智能体协作模拟了真实工作场景中的团队合作。每个Agent被赋予不同的角色,如CEO、产品经理或程序员,共同完成复杂任务。这种模式虽然有时效果不稳定,但展现了巨大的潜力。
图6:Multi-agent协作示例
结论与展望
吴恩达认为,Agent技术的发展将推动AI应用的创新。虽然目前Agent的响应速度仍需优化,但其带来的价值已经超越了单纯等待更强大模型的升级。Agent不仅是通往AGI道路上的重要里程碑,更是当前AI应用开发中不可或缺的技术手段。
Path to AGI feels like a journey rather than a destination, but I think agentic workflow could help us take a small step forward on this very long journey.
通往人工通用智能的道路,宛如一场旅程而非终点,但我相信,Agent能帮助我们在这条漫长征途上迈出微小而坚实的一步。