问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

AI Agent技术栈全解析:从模型服务到托管服务

创作时间:
作者:
@小白创作中心

AI Agent技术栈全解析:从模型服务到托管服务

引用
CSDN
1.
https://blog.csdn.net/2401_85375151/article/details/145125186

2024年,AI技术从简单的聊天机器人向更复杂的智能体转变。AI agent能够自主行动、执行任务,并与外部工具交互,这使得它们背后的技术栈与传统的LLM技术栈有很大的不同。本文将为您详细解析AI agent的技术栈,帮助您了解这个快速发展的领域。

从 LLM 到 Agent:一场深刻的进化

在2022和2023年,我们见证了LLM框架和SDK的爆发,如LangChain和LlamaIndex。与此同时,LLM的使用也变得更加方便,无论是通过API调用还是自行部署(比如vLLM和Ollama)。

然而,到了2024年,大家的目光开始转向更高级的AI "agent"。这个概念虽然早在AI领域就存在,但在ChatGPT时代,它有了新的内涵:能够自主行动、执行任务,并与外部工具交互的LLM

这种转变意味着,我们需要一套全新的技术栈来支撑agent的发展。

Agent 技术栈:核心差异在哪里?

Agent不仅仅是会聊天的大模型,它们更像是具备一定自主性的智能体。它们需要管理自己的状态(例如,对话历史和记忆)、调用各种工具,并且安全执行。这使得agent的技术栈和传统的LLM技术栈有很大的不同。

让我们从底层到顶层,逐一剖析agent技术栈的关键组成部分:

1. 模型服务:AI 的大脑

  • 核心:LLM。这是AI agent的核心动力。
  • 服务方式:通过推理引擎提供服务,通常是付费/自己部署API。
  • 主要玩家:
  • 闭源模型:OpenAI和Anthropic领跑。
  • 开源模型:Together.AI、Fireworks和Groq等提供商开始崭露头角,提供基于Llama 3等模型的服务。
  • 本地部署:vLLM成为生产级GPU服务的主流选择,而Ollama和LM Studio则深受个人爱好者的喜爱。

2. 存储:记忆的基石

  • 核心:持久化状态,如对话历史、记忆和外部数据。
  • 关键技术:
  • 向量数据库:Chroma、Weaviate、Pinecone、Qdrant和Milvus等用于存储agent的“外部记忆”,应对大容量数据。
  • 传统数据库:Postgres通过pgvector扩展也开始支持向量搜索。
  • 为何重要?Agent是有状态的,需要长期存储和检索信息。

3. 工具与库:能力的扩展

  • 核心:使agent能够执行各种任务的“工具”(或“函数”)。
  • 调用方式:通过LLM生成的结构化输出(例如,JSON对象)指定要调用的函数和参数。
  • 安全执行:使用沙箱(如Modal和E2B)来确保工具执行的安全性。
  • 工具生态:
  • 通用工具库:Composio等。
  • 专用工具:Browserbase(网页浏览)、Exa(网页搜索)等。
  • 为何重要?工具扩展了agent的能力边界,让它们能够完成更复杂的任务。

4. Agent 框架:编排智能的指挥中心

  • 核心:负责编排LLM调用,管理agent状态。
  • 关键特性:
  • 状态管理:如何保存和加载agent状态,例如对话历史和记忆。
  • 上下文窗口:如何将状态信息“编译”到LLM的上下文窗口中。
  • 跨agent通信:如何实现多agent之间的协作。
  • 内存管理:如何应对LLM有限的上下文窗口,管理长期记忆。
  • 开源模型支持:如何让agent更好地利用开源模型。
  • 热门框架:Llama Index、CrewAI、AutoGen、Letta、LangGraph等。
  • 为何重要?框架决定了agent的运行方式和效率。

5. Agent 托管与服务:未来趋势

  • 核心:将agent作为服务进行部署,通过API进行访问。
  • 当前痛点:状态管理、安全工具执行以及规模化部署是难题。
  • 未来展望:未来将会出现标准化的Agents API,让agent的部署更加便捷。
  • 为何重要?这将使agent从原型走向真正的应用。

未来已来:agent 技术栈正在高速发展

Agent技术栈整体仍然非常年轻,但它正在以惊人的速度发展。未来的agent将会更加智能、更加自主,它们将会在各行各业发挥重要的作用。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号