吴恩达谈AI智能体:AI的真正价值在应用端
吴恩达谈AI智能体:AI的真正价值在应用端
AI智能体的崛起正在改变我们构建应用程序的方式。在2024年BUILD大会上,AI领域权威专家吴恩达深入探讨了AI智能体工作流的独特价值及其未来发展趋势。他指出,AI的真正价值在于其应用,并详细介绍了智能体工作流的四大设计模式:反思、工具调用、规划和多智能体协作。
图源:WIRED
AI的真正价值在于它的应用
在演讲中,吴恩达形象地表示:
AI是我们这个时代的电力,它是一种通用技术。就像电一样,如果我问你电有什么用,你很难回答,因为它的用途实在太广泛了。
他强调,AI正在为我们创造一系列前所未有的机会,特别是在构建新的应用程序方面,新一代AI技术正在帮助我们创造那些出过去无法实现的应用。
吴恩达指出,在技术架构方面,当前的AI技术不仅依赖于底层的半导体和云服务基础设施,还依赖于应用层的创新。他认为,尽管目前引起最多讨论和话题的往往是新技术(如生成式AI),但AI的真正价值往往隐藏在应用层面。AI的成功不仅仅在于技术本身,还在于如何将这些技术转化为能够带来真正价值的应用。
图源:Digital Media Ninja
过去,构建一个应用可能需要数月甚至一年时间,但如今,借助生成式AI,开发团队能够在短短几天内构建出原型,并迅速测试其效果。
AI智能体工作流:AI发展的新引擎
在吴恩达看来,当前AI领域最值得关注的趋势是AI智能体工作流(Agentic AI Workflows)。AI智能体指的是那些能在执行任务的过程中进行自我反思、规划和调整的AI系统,具有更高的任务执行效率和质量。
他解释道,传统的零样本提示(Zero-shot prompting)方法往往让AI一次性从头到尾生成完整的内容,而AI智能体工作流则是一个分步骤、循环迭代的过程。以写作任务为例,如果我们要生成一篇文章,传统的方式是让AI直接从头到尾写完它,而AI智能体则会让AI先生成文章大纲,再进行网络搜索,最终多次修改和调整初稿。通过这种方式,我们能获得比传统模式更好的结果。
智能体工作流示意图。图源:Scalable Path
AI智能体工作流在一些实际的基准测试中表现出色。例如,在编程题目的解决上,使用AI智能体工作流的GPT-3.5模型准确率高达95%,远高于标准的GPT-3.5和GPT-4模型的表现。
智能体工作流的四大设计模式
吴恩达进一步介绍了智能体工作流中的四种关键设计模式:反思(Reflection)、用途(Use)、规划(Planning)和多代理协作(Multi-agent Collaboration)。
反思 Reflection
通过反思,AI不仅执行任务,还会自我批评并优化结果。例如,当AI生成了代码后,我们可以要求它反思并评价自己的代码,然后根据反馈改进输出。这种方法能够帮助AI提升其基础性能,使其达到更高水平。
工具调用 Tool Use
工具调用强调AI可以使用外部API来执行各种操作,例如进行网络搜索、发邮件或发放退款。随着这些功能的逐步引入,AI可以在更多的实际应用场景中发挥作用。
规划 Planning
在规划模式下,AI会根据任务的复杂度进行任务分解,并自行选择最佳的行动顺序来执行。
多智能体协作 Multi-agent Collaboration
多代理协作模式指通过多个AI代理的协同工作来完成复杂任务。这种模式类似于在CPU中运行多个进程,能够将大任务分解为多个小任务,由不同的智能体同时处理,从而提升整体处理效率。
未来AI的四大趋势
最后,吴恩达总结了四个值得关注的AI发展趋势:
Token生成速度提高:智能体工作流需要处理大量的文本和图像数据,因此,提高Token的生成速度成为了AI发展的关键。随着半导体和硬件创新的推进,代理智能工作流将变得更加高效。
工具调用的优化:未来的大模型不仅可以回答用户的提问,还能够执行实际操作。能够调用工具的大模型的出现将极大地扩展智能体工作流的应用范围。
非结构化数据工程的崛起:传统的结构化数据已经不能满足AI的需求,随着生成式AI的兴起,处理非结构化数据(如文本、图像和视频)的能力变得越来越重要。吴恩达强调:“数据工程将成为AI发展的核心,如何高效管理和使用非结构化数据将是企业面临的重要课题。”。
图像处理技术革命:当前,图像处理技术正在迎来快速发展阶段,未来将有更多的企业能够利用视觉数据创造新的应用,推动AI应用场景进一步多元化。