资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

4 种主流Agent 设计模式及应用场景

创作时间:

作者:

@小白创作中心

4 种主流Agent 设计模式及应用场景

引用

CSDN

https://m.blog.csdn.net/lvaolan168/article/details/144614497

AI Agent是一种能够在一定程度上自主执行任务、做出决策并与环境交互的人工智能系统。与传统人工智能模型相比，AI Agent通常被设计为更加灵活和适应性强的实体，它们能够理解复杂的指令，甚至在没有明确编程的情况下解决问题。

AI Agent 概述

AI Agent 是一种人工智能系统，它能够在一定程度上自主地执行任务、做出决策并与之交互。

与传统的人工智能模型相比，AI Agent 通常被设计为更加灵活和适应性强的实体，它们能够理解复杂的指令，甚至在没有明确编程的情况下解决问题。

Agent 通过迭代的对话和反思过程，能够自我改进和优化输出，从而在多种应用场景中提供更加精准和个性化的服务。

随着技术的进步，AI Agent 的能力正在不断扩展，预示着未来它们将在自动化、数据分析、用户体验优化等领域发挥更加关键的作用。

今天很多人使用LLM的习惯，通过一个非 Agent 型的workflow工作流，输入一个提示，大模型生成一个回答（零样本提示）。

在 AI Agent 的使用中，用户给 AI 一个任务，AI 在没有任何额外信息或提示的情况下尝试完成这个任务。

例如，如果用户要求 AI 编写一个特定功能的代码，zero-shot 提示意味着 AI 需要在没有任何进一步指导或迭代的情况下立即生成正确的代码。

Agent 型工作流，通过多次迭代工作流完成任务。如上图所示。

Agent 主流的设计模式有：

吴恩达教授在红杉美国 AI 峰会上谈到有 4 种主要的 Agent 设计模式：

Reflection：让 Agent 审视和修正自己生成的输出；例如，可以让 Agent 生成代码，然后再让同一个 Agent 检查和改进这段代码。
Tool Use：LLM 生成代码、调用 API 等进行实际操作；这种模式已经有一定的成熟度和可靠性。
Planning：让 Agent 分解复杂任务并按计划执行；吴恩达教授通过一个例子说明了规划模式的强大之处，即生成一张特定姿势的女孩图片，Agent 需要通过多个步骤来完成这个任务，包括确定姿势、找到模型、合成图像等。
Multiagent Collaboration：多个 Agent 扮演不同角色合作完成任务；例如，一个 Agent 作为代码编写者，另一个作为代码审查者，通过合作提高代码质量。

Reflection 设计模式

概述

Reflection（反思）设计模式是AI智能体工作流中的一种策略，它允许智能体（如大型语言模型LLM）检查自己的输出并提出改进方法。核心在于迭代和对话式的交互，与传统的一次性输出不同，反思模式通过多次的自我评估和修改，逐步构建更高质量的输出。

背景

智能体不仅仅是执行命令的工具，而是可以通过自我反思和迭代学习来提升性能和输出质量的实体。这种设计模式的提出，反映了AI从静态响应向动态、自适应系统的转变，强调了智能体在处理复杂任务时的自学习能力和适应性。

案例

代码编写与审查：在编程领域，LLM可以生成代码片段来执行特定任务。通过反思模式，LLM可以在生成代码后，再次审视代码的正确性、风格和效率，并提出改进意见。例如，如果LLM生成了一个函数，它可以被提示重新检查这个函数，并提出如何改进它的建议。
文本生成与编辑：在撰写文章或报告时，LLM可以先生成初稿，然后通过反思模式，对文本进行自我评估和修订。这可以帮助LLM发现和修正错误，提高文本的质量和可读性。
问题解决与决策：在面对复杂问题时，LLM可以通过反思模式，提出解决方案，然后对这些方案进行评估和优化。这种方法可以帮助智能体更好地理解问题，提出更有效的解决策略。
多智能体协作：在多智能体系统中，不同的智能体可以扮演不同的角色，例如一个负责生成解决方案，另一个负责评估和提出改进意见。通过这种协作和反思过程，可以推动整个系统的决策和执行过程向更高层次发展。

复现

以下是一个基本的提示词框架，可以应用于Reflection设计模式：

任务理解 (Task Understanding)

任务描述：请描述你被分配的任务是什么？
目标明确：这个任务的最终目标是什么？
关键点识别：任务中有哪些关键点需要特别注意？

初步执行 (Initial Execution)

方法选择：你打算采用什么方法来执行这个任务？
初步结果：执行后得到了什么样的初步结果？
结果评估：这个结果是否符合预期？如果不符合，差距在哪里？

反思与评估 (Reflection and Evaluation)

优点分析：在初步执行中，哪些方面做得好？
不足识别：哪些方面存在问题或可以改进？
改进策略：针对不足之处，你打算如何进行改进？

改进实施 (Improvement Implementation)

改进措施：具体将采取哪些措施来改进任务执行？
二次执行：经过改进后，再次执行任务的结果如何？
效果对比：与初次执行相比，改进措施带来了哪些变化？

结果总结 (Result Summarization)

最终成果：最终完成任务的结果是什么？
学习点总结：从整个过程中学到了哪些宝贵的经验？
未来应用：这些经验将如何帮助你在未来的任务中表现得更好？

Tool Use 设计模式

左边：Copilot 的截图，右边：GPT-4 截图

事实证明，LLM的外部工具不仅限于数据分析、搜索引擎、个人生产力、图像处理等。

概述

Tool use（工具使用）设计模式是AI智能体工作流中的一种策略，它指的是智能体（如大型语言模型LLM）利用各种工具来增强自己的功能，包括但不限于网络搜索、代码执行、数据分析等，以帮助其收集信息、采取行动或处理数据3。

这种模式的核心在于扩展智能体的能力，使其能够更加高效和精准地完成任务。

背景

为了使智能体能够更好地适应复杂多变的任务需求，研究者和开发者开始探索如何让智能体不仅仅依赖于内置的知识库，而是能够主动利用外部工具和资源。

Tool use设计模式应运而生，它强调智能体的自主性和适应性，通过与外部工具的交互，提升智能体的问题解决能力和工作效率。

应用案例

代码自动生成与优化：在软件开发中，智能体可以通过Tool use模式调用代码生成工具，如GitHub Copilot3，自动生成代码片段或提供代码建议，从而加速开发过程并提高代码质量。
数据分析与可视化：智能体可以利用数据分析工具，如数据可视化库或在线数据分析服务，对收集到的数据进行处理和分析，生成直观的图表和报告，帮助用户更好地理解数据内容和趋势。
智能搜索引擎：通过Tool use模式，智能体可以集成搜索引擎的功能，不仅提供简单的关键词搜索，还能进行语义理解和智能推荐，为用户提供更加精准和个性化的搜索结果。
自动化测试与调试：在软件测试领域，智能体可以调用自动化测试工具，执行单元测试、集成测试等，及时发现并修复代码中的错误，提高软件的稳定性和可靠性。
智能助手与自动化流程：在企业运营中，智能体可以结合各种办公自动化工具，如日程管理、邮件处理、项目管理等，帮助员工提高工作效率，减少重复性劳动。

复现

coze支持插件的调用。

链接：https://www.coze.cn/store/plugin

Planning 设计模式

概述

Planning（规划）设计模式是AI智能体工作流中的一种策略，它允许智能体分解复杂任务并按计划执行。

核心在于将一个大的、复杂的任务分解成多个小的、可管理的子任务，并通过预先规划的步骤来逐一完成这些子任务，最终实现整个任务的目标。

背景

为了处理更加复杂和动态的任务，智能体需要具备更高级的执行策略。

传统的AI模型可能在处理简单任务时表现良好，但在面对需要多步骤、长期规划的任务时，其性能往往受限。

规划模式应运而生，它借鉴了人类在面对复杂问题时的解决策略，即通过规划和执行一系列的行动步骤来达成目标。

应用案例

自动化内容创作：在媒体和内容创作领域，智能体可以使用规划模式来生成文章或报告。例如，智能体首先确定文章的主题和结构，然后收集相关信息和数据，接着撰写各个部分，最后进行编辑和校对，以确保内容的质量和准确性。
智能项目管理：在项目管理中，智能体可以通过规划模式来协助项目团队。它可以帮助定义项目目标、分解任务、分配资源、制定时间表，并监控项目进度，确保项目按计划进行。
机器人路径规划：在机器人技术中，智能体可以使用规划模式来导航和路径规划。例如，一个送货机器人需要规划从起点到终点的最优路径，同时避开障碍物，并根据实时环境变化调整计划。
智能教育系统：在教育领域，智能体可以利用规划模式来设计个性化的学习计划。它可以根据学生的学习进度、兴趣和能力，制定合适的学习目标、课程内容和练习任务，帮助学生高效学习。
复杂问题解决：在科学研究或工程设计中，智能体可以通过规划模式来解决复杂问题。它可以通过模拟实验、分析数据、优化方案等步骤，逐步逼近问题的解决方案。

复现

以下是一个基本的提示词框架，可以应用于Planning设计模式：

任务定义 (Task Definition)

目标设定：请明确任务的最终目标是什么？
任务描述：请详细描述需要完成的任务。
约束条件：任务完成过程中有哪些限制或约束条件？

子任务分解 (Subtask Decomposition)

关键步骤识别：任务可以分解为哪些关键步骤？
优先级排序：这些步骤应如何排序以优化执行流程？
资源分配：每个子任务需要哪些资源或技能？

计划制定 (Plan Formulation)

行动方案：为每个子任务制定具体的行动方案。
时间规划：为每个子任务设定合理的时间表。
风险评估：评估计划中可能遇到的风险和挑战。

执行监控 (Execution Monitoring)

进度跟踪：如何跟踪每个子任务的进度？
问题应对：遇到计划之外的问题时，如何应对和调整？
反馈循环：如何收集执行过程中的反馈并用于改进计划？

评估与调整 (Evaluation and Adjustment)

结果评估：子任务完成后，如何评估结果？
计划调整：根据评估结果，是否需要对剩余任务的计划进行调整？
经验总结：从已完成的子任务中总结经验教训。

任务完成 (Task Completion)

总结报告：任务完成后，编写总结报告，包括成功的地方和改进的空间。
后续行动：基于本次任务的经验，规划未来的行动或任务。

Multiagent Collaboration 设计模式

左边是一篇名为 ChatDev 的论文的截图

ChatDev 拟作一个由多智能体协作运营的虚拟软件公司，在人类“用户”指定一个具体的任务需求后，不同角色的智能体将进行交互式协同，以生产一个完整软件（包括源代码、环境依赖说明书、用户手册等）。这一技术为软件开发自动化提供了新的可能性，支持快捷高效且经济实惠的软件制作，未来将有效地将部分人力从传统软件开发的繁重劳动中解放出来。

概述

Multiagent Collaboration（多智能体协作）设计模式是指在一个系统中，多个智能体（Agent）通过合作来共同完成复杂任务的策略。

基本理念是，通过智能体之间的分工与合作，可以更有效地解决问题，提高整体的工作效率和任务完成的质量。

在多智能体系统中，每个智能体都具有特定的角色和功能，它们通过交流和协作来实现共同的目标。

背景

单一的智能体在处理更加复杂和动态的现实世界任务时，单一智能体的局限性开始显现。为了克服这些局限性，研究者和开发者开始探索多智能体系统，通过智能体之间的协作来扩展系统的能力。

多智能体协作设计模式的提出，受到了人类社会合作机制的启发。在人类社会中，个体通过合作和分工来完成超出个人能力范围的任务。多智能体系统通过模拟这种合作机制，使得每个智能体可以专注于自己擅长的领域，同时与其他智能体协作，共同解决问题。

应用案例

软件开发：在软件开发领域，多智能体系统可以模拟不同的开发角色，如架构师、开发人员、测试人员等，通过协作完成软件项目的各个阶段。例如，一个智能体负责编写代码，另一个负责代码审查和测试，而另一个则负责文档编写和用户支持。
法庭模拟：在法律领域，多智能体系统可以模拟法庭审判过程，其中不同的智能体扮演律师、法官、证人等角色，通过交互和辩论来模拟案件审理过程，从而为法律教育和研究提供支持。
智能客服：在客户服务领域，多智能体系统可以提供更加个性化和高效的服务。例如，一个智能体负责理解用户的问题，另一个负责提供解决方案，而另一个则负责跟进用户的反馈和满意度。
自动化内容创作：在媒体和内容创作领域，多智能体系统可以协作生成文章、视频或其他类型的内容。每个智能体可以负责内容创作的一部分，如撰写、编辑、设计等，最终通过协作完成高质量的作品。
复杂问题解决：在科学研究和工程设计中，多智能体系统可以模拟专家小组的工作方式，通过智能体之间的协作和知识共享，解决复杂的科学问题或设计挑战。