问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

吴恩达最新演讲:四种 Agent 设计范式详解

创作时间:
作者:
@小白创作中心

吴恩达最新演讲:四种 Agent 设计范式详解

引用
1
来源
1.
https://53ai.com/news/qianyanjishu/427.html

吴恩达教授最近在红杉AI峰会上分享了他对Agent的最新见解。尽管一些媒体已经进行了相关报道,但为了确保内容的准确性和可读性,本文对演讲内容进行了重新整理和翻译,力求让不同背景的读者都能无障碍地理解。

传统Prompt与Agentic Workflow的对比

在使用ChatGPT等AI工具时,我们通常采用传统的Prompt方式:输入一个问题,得到一个答案。这类似于直接要求某人完成一篇文章的写作。相比之下,Agentic Workflow则更像是一种指导性的写作过程:先制定大纲,查找资料,撰写草稿,然后反复修改和完善。


图1:传统Prompt与Agentic Workflow的对比

HumanEval案例研究

吴恩达团队使用HumanEval数据集进行了一项案例研究,该数据集由OpenAI设计用于评估编程语言模型。研究发现,直接使用Zero-shot方式(不提供具体训练样本或标签提示)编写代码并运行,并不是一个明智的做法。


图2:HumanEval案例研究示例

研究结果表明:

  • GPT3.5 + Zero-shot的正确率为48%
  • GPT4 + Zero-shot的正确率为67%
  • GPT3.5 + Agentic Workflow的效果甚至超过了GPT4

这充分说明了Agent在构建AI应用中的重要性。

Agent的四种设计范式

吴恩达将Agent的设计模式分为四类:Reflection、Tool Use、Planning和Multi-agent。其中,Reflection和Tool Use属于较为经典且已广泛应用的方式,而Planning和Multi-agent则展现出更大的潜力和前景。

Reflection(反思)

Reflection机制允许AI系统自我检查和迭代改进。例如,当AI生成一段代码后,会自动检查其正确性并提出修改建议。这种自我纠错的过程可以显著提高代码质量。


图3:Reflection机制示例

此外,还可以通过多Agent协作的方式进一步优化:一个Agent负责编写代码,另一个负责Debug。这种方式在很多场景中都表现出色。


图4:多Agent协作示例

Tool Use(工具使用)

通过调用外部插件,LLM的能力边界得到了极大拓展。常见的应用场景包括使用Copilot进行网络搜索,或在解决数理逻辑问题时调用代码插件。

Planning(规划)

Planning机制允许AI将复杂任务分解为多个子任务,并依次执行。例如,在生成特定图片时,AI会先提取参考图片的姿态特征,然后选择合适的模型生成目标图片,最后进行文字描述。


图5:Planning机制示例

Multi-agent(多智能体协作)

多智能体协作模拟了真实工作场景中的团队合作。每个Agent被赋予不同的角色,如CEO、产品经理或程序员,共同完成复杂任务。这种模式虽然有时效果不稳定,但展现了巨大的潜力。


图6:Multi-agent协作示例

结论与展望

吴恩达认为,Agent技术的发展将推动AI应用的创新。虽然目前Agent的响应速度仍需优化,但其带来的价值已经超越了单纯等待更强大模型的升级。Agent不仅是通往AGI道路上的重要里程碑,更是当前AI应用开发中不可或缺的技术手段。

Path to AGI feels like a journey rather than a destination, but I think agentic workflow could help us take a small step forward on this very long journey.

通往人工通用智能的道路,宛如一场旅程而非终点,但我相信,Agent能帮助我们在这条漫长征途上迈出微小而坚实的一步。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号