问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

AI Agent入门：Agent角色指令设计

创作时间:

作者:

@小白创作中心

AI Agent入门：Agent角色指令设计

引用

CSDN

1.

https://blog.csdn.net/csdn_xmj/article/details/140386271

AI Agent作为人工智能领域的重要研究方向，其核心思想是使用语言模型（LLM）作为推理的大脑，通过制定计划和借助工具来解决问题。本文将从Agent的基本概念、架构、实现逻辑以及在LangChain中的具体应用等方面进行详细讲解，并提供角色指令设计的完整指南。

0、概要

Agent的核心思想是使用语言模型（LLM）作为推理的大脑，以制定解决问题的计划、借助工具实施动作。在agents中几个关键组件如下：

LLM：制定计划和思考下一步需要采取的行动。
Tools：解决问题的工具
Toolkits：用于完成特定目标所需的工具组。一个toolkit通常包含3-5个工具。
AgentExecutor：AgentExecutor是agent的运行时环境。这是实际调用agent并执行其选择的动作的部分。

1、Agent整体架构

代理（Agents）涉及LLM做出决策以确定要采取哪些行动，执行该行动，查看观察结果并重复执行步骤直到完成。

在LLM驱动的自主代理系统中，LLM充当代理的大脑，并辅以几个关键功能：

规划

子目标拆解：agent将大型任务拆解为小型的、可管理的子目标，从而能够高效处理复杂任务。
反思和改进：agent可以从过去的行为中进行自我批评和自我反省。这种从错误中吸取教训，并对未来的步骤进行改进的思维可以有效提高最终结果。真种思维方式来自ReAct，其大致格式为：Thought: ...Action: ...Observation: ... (Repeated many times)。即为ReAct模式。

记忆

短期记忆：上下文学习是利用模型的短期记忆来学习的。
长期记忆：通过利用外部向量存储和快速检索，agen可以实现长时间保留和回忆（无限）信息的能力。

工具使用

代理学习调用外部 API 以获取模型权重中缺少的额外信息（通常在预训练后很难更改），包括当前时讯、代码执行能力、对私有信息源的访问等。自然可以自定义工具使用，如本地向量数据库查找。自定义工具方法类：

2、Agent业务实现逻辑

Agent的业务流程如下图所示：

用户提出问题
Agent基于预设的Prompt，将问题包装之后送给LLM
LLM返回给Agent结果和需要使用的工具
Agent使用工具获取必要信息
工具返回给Agent获取到的信息
打包上下文发再次送给LLM
LLM返回给Agent结果
Agent给用户返回最终结果

3、LangChain中Agent实现

LangChain为代理提供了标准接口，一系列可供选择的代理类型。langchain中agent有两种主要类型：

动作代理人（Action agents）

在每个时间步上，使用所有先前动作的输出决定下一个动作。

接收用户输入
决定是否使用任何工具以及工具输入
调用工具并记录输出（也称为“观察结果”）
使用工具历史记录、工具输入和观察结果决定下一步
重复步骤 3-4，直到确定可以直接回应用户

计划执行代理人（Plan-and-execute agents）

预先决定所有动作的完整顺序，然后按照计划执行，而不更新计划。

接收用户输入
规划要执行的全部步骤序列
按顺序执行步骤，将过去步骤的输出作为未来步骤的输入
动作代理人适用于小任务，遵循ReAct模式。而计划执行代理人适用于复杂或长时间运行的任务，这些任务需要保持长期目标和重点。

4. Agent示例代码

5、Agent角色指令的概念

5.1 角色指令的定义

决定AI智能体的行为
决定AI智能体的输出效果
匹配场景使用

5.2 角色指令的万能公式

角色设定万能公式 = 角色设定 + 使用场景 + 工具 + 限制 + 输出样式（附加：+例子）

角色设定：设定您想让Agent扮演的角色，可以给出一些您期望它具备的能力。
使用场景+工具：描述您的应用背景，并给出相应背景下使用的工具，让大模型可以在更为精确的场景下用匹配的工具行动。
限制：明确当用户输入什么信息下生成什么样的结果，使得答案更为精准。
输出样式：输出风格和格式要求，使大模型更为匹配您的需求。可以附带一些例子，使其理解更为透彻。

6、角色指令的优化策略

6.1 角色设定策略

给出角色设定请尽可能清晰简短，尽量直接表述角色名称，同样也可以附加一些你所期望的能力作为补充。

6.2 工具选择

代码解释器：代码解释器支持应用运行代码，具备分析数据、url信息提炼、处理上传文件、数学运算等功能。
文生图：大模型将结合文心一格生成对应图像。
知识问答-百度搜索：大模型将结合百度搜索结果回答问题。
知识问答-知识库检索：大模型将基于您上传的知识文档回答问题，可选择直接上传文件，或选择已有知识集合。知识集合相关内容可查看文档我的知识。

6.3 场景工具策略

尽可能一一对应
做出描述
简洁、直接

6.4 限制

尽可能一一对应
描述越具体越好

6.5 输出样式策略

清晰明了
提出具体的要求
例如：字数、回答样式等

6.6 给出示例

主要用于需要有特定回复的时候
请给出特定的问题和相应答复

本文原文来自公众号“机器学习算法与Python实战”。

热门推荐

鼻子痛什么原因引起的

鼻子痛什么原因引起的

防风汤的功效与使用注意事项

防风汤的功效与使用注意事项

两种思维：固定型思维和成长型思维

两种思维：固定型思维和成长型思维

“美国梦”之死，寒门再难出贵子

“美国梦”之死，寒门再难出贵子

金相玉印：一种古老的文化遗产与象征意义

金相玉印：一种古老的文化遗产与象征意义

西兰花能生吃吗？健康新视角，西兰花生吃的奥秘与美味探索

西兰花能生吃吗？健康新视角，西兰花生吃的奥秘与美味探索

应收账款质押合同通知书：法律性质、效力及实务操作分析

应收账款质押合同通知书：法律性质、效力及实务操作分析

炎炎夏日游泳季预防腺病毒传播至关重要

炎炎夏日游泳季预防腺病毒传播至关重要

胫骨骨折术后怎样恢复

胫骨骨折术后怎样恢复

海南有149种淡水鱼其中特有鱼类23种

海南有149种淡水鱼其中特有鱼类23种

历史揭秘：二战后日本为何未能被瓜分？

历史揭秘：二战后日本为何未能被瓜分？

关于猴子的知识

关于猴子的知识

地中海贫血的机制

地中海贫血的机制

“晕车星人”也能愉快出行？这几招让你轻松到家！

“晕车星人”也能愉快出行？这几招让你轻松到家！

三伏贴的作用与功效

三伏贴的作用与功效

一年级数学：凑十法、平十法、破十法，这么教孩子一听就懂

一年级数学：凑十法、平十法、破十法，这么教孩子一听就懂

血液的成分及主要功能是什么

血液的成分及主要功能是什么

未分配利润和净利润之间有什么关系？

未分配利润和净利润之间有什么关系？

壶腹肿瘤术后生存指南：良性与恶性肿瘤的应对之道

壶腹肿瘤术后生存指南：良性与恶性肿瘤的应对之道

厄瓜多尔特有蜂鸟或已灭绝：绿松石颈蜂鸟百年未见

厄瓜多尔特有蜂鸟或已灭绝：绿松石颈蜂鸟百年未见

凝聚校家社三方力量，创建“未来学习者社区”

凝聚校家社三方力量，创建“未来学习者社区”

当“姐妹”成为脱口秀的方法论

当“姐妹”成为脱口秀的方法论

2025南宁卫生学校有哪些南宁卫生学校名单

2025南宁卫生学校有哪些南宁卫生学校名单

南宁最有名的土特产是什么？广西南宁必买的十大特产清单。

南宁最有名的土特产是什么？广西南宁必买的十大特产清单。

如何做好网上群众工作？来看人民网这个案例

如何做好网上群众工作？来看人民网这个案例

儿童急性肠胃炎的症状和最佳疗法

儿童急性肠胃炎的症状和最佳疗法

别再让老人孤独终老！养老院服务质量提升，让爱延续

别再让老人孤独终老！养老院服务质量提升，让爱延续

从疑罪从无原则看无罪辩护的实践运用，并案例分析

从疑罪从无原则看无罪辩护的实践运用，并案例分析

疑罪从无与无罪推定的区别有哪些

疑罪从无与无罪推定的区别有哪些

我的世界与迷你世界谁更好玩究竟谁更胜一筹

我的世界与迷你世界谁更好玩究竟谁更胜一筹

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号