AI Agent技术栈全解析:从模型服务到托管服务
创作时间:
作者:
@小白创作中心
AI Agent技术栈全解析:从模型服务到托管服务
引用
CSDN
1.
https://blog.csdn.net/2401_85375151/article/details/145125186
2024年,AI技术从简单的聊天机器人向更复杂的智能体转变。AI agent能够自主行动、执行任务,并与外部工具交互,这使得它们背后的技术栈与传统的LLM技术栈有很大的不同。本文将为您详细解析AI agent的技术栈,帮助您了解这个快速发展的领域。
从 LLM 到 Agent:一场深刻的进化
在2022和2023年,我们见证了LLM框架和SDK的爆发,如LangChain和LlamaIndex。与此同时,LLM的使用也变得更加方便,无论是通过API调用还是自行部署(比如vLLM和Ollama)。
然而,到了2024年,大家的目光开始转向更高级的AI "agent"。这个概念虽然早在AI领域就存在,但在ChatGPT时代,它有了新的内涵:能够自主行动、执行任务,并与外部工具交互的LLM。
这种转变意味着,我们需要一套全新的技术栈来支撑agent的发展。
Agent 技术栈:核心差异在哪里?
Agent不仅仅是会聊天的大模型,它们更像是具备一定自主性的智能体。它们需要管理自己的状态(例如,对话历史和记忆)、调用各种工具,并且安全执行。这使得agent的技术栈和传统的LLM技术栈有很大的不同。
让我们从底层到顶层,逐一剖析agent技术栈的关键组成部分:
1. 模型服务:AI 的大脑
- 核心:LLM。这是AI agent的核心动力。
- 服务方式:通过推理引擎提供服务,通常是付费/自己部署API。
- 主要玩家:
- 闭源模型:OpenAI和Anthropic领跑。
- 开源模型:Together.AI、Fireworks和Groq等提供商开始崭露头角,提供基于Llama 3等模型的服务。
- 本地部署:vLLM成为生产级GPU服务的主流选择,而Ollama和LM Studio则深受个人爱好者的喜爱。
2. 存储:记忆的基石
- 核心:持久化状态,如对话历史、记忆和外部数据。
- 关键技术:
- 向量数据库:Chroma、Weaviate、Pinecone、Qdrant和Milvus等用于存储agent的“外部记忆”,应对大容量数据。
- 传统数据库:Postgres通过pgvector扩展也开始支持向量搜索。
- 为何重要?Agent是有状态的,需要长期存储和检索信息。
3. 工具与库:能力的扩展
- 核心:使agent能够执行各种任务的“工具”(或“函数”)。
- 调用方式:通过LLM生成的结构化输出(例如,JSON对象)指定要调用的函数和参数。
- 安全执行:使用沙箱(如Modal和E2B)来确保工具执行的安全性。
- 工具生态:
- 通用工具库:Composio等。
- 专用工具:Browserbase(网页浏览)、Exa(网页搜索)等。
- 为何重要?工具扩展了agent的能力边界,让它们能够完成更复杂的任务。
4. Agent 框架:编排智能的指挥中心
- 核心:负责编排LLM调用,管理agent状态。
- 关键特性:
- 状态管理:如何保存和加载agent状态,例如对话历史和记忆。
- 上下文窗口:如何将状态信息“编译”到LLM的上下文窗口中。
- 跨agent通信:如何实现多agent之间的协作。
- 内存管理:如何应对LLM有限的上下文窗口,管理长期记忆。
- 开源模型支持:如何让agent更好地利用开源模型。
- 热门框架:Llama Index、CrewAI、AutoGen、Letta、LangGraph等。
- 为何重要?框架决定了agent的运行方式和效率。
5. Agent 托管与服务:未来趋势
- 核心:将agent作为服务进行部署,通过API进行访问。
- 当前痛点:状态管理、安全工具执行以及规模化部署是难题。
- 未来展望:未来将会出现标准化的Agents API,让agent的部署更加便捷。
- 为何重要?这将使agent从原型走向真正的应用。
未来已来:agent 技术栈正在高速发展
Agent技术栈整体仍然非常年轻,但它正在以惊人的速度发展。未来的agent将会更加智能、更加自主,它们将会在各行各业发挥重要的作用。
热门推荐
DDR3、DDR4、DDR5的演变与创新:更快、更省电,但仍有瓶颈
夫妻之间没有爱了,别随便断绝关系,最好的对策这样做
阿斯巴甜会引起血糖升高吗
新加坡推出茁长SG计划:明确儿童屏幕使用时间标准
探秘龟背竹:从外观特点到栽培技巧的全方位指南
龙眼叶养龟有用吗
拉伸:解锁运动潜能,加速恢复的艺术之旅
乳糖不耐受患者适合选择哪些益生菌?
古代官员府邸的建筑规格与社会等级
怎么去除脸上的毛
哪三款车被称为马路三大妈
直流电路中RC充放电回路公式推导
40多天出栏的白羽肉鸡正常吗?
开放式基金投资指南:如何选择适合你的基金
百家姓之24—张姓,起源·迁徙·家训·名人故事
美食书籍排行榜前十名:第一文笔出众,醉酒简史上榜
小区装修施工时间对居民有什么影响?
注意了!这几大征兆,2025年起退休老人的日子,越来越不好过
如何规划家庭的赡养老人预算?
移动端显卡性能天梯图,哪些显卡值得关注?
云南五天四晚深度游:专为情侣打造的浪漫之旅
去洱海一般住哪里合适?酒店选择与云南旅游注意事项
如何测试自己适合哪个发型:虚拟试发软件与AI技术的应用
皮蛋瘦肉粥怎么做好吃又营养丰富
左手抱拳与右手抱拳,到底有什么区别?搞不清楚很容易闹笑话的
竹笋炒肉的烹饪技巧:从选材到出锅的完整指南
日本AI发现世界最强铁基超导永磁体,或带来革命性突破!
股票定增的定价依据是什么?这种定价方式存在哪些挑战?
轻松聊疗:认识正确的握笔姿势,握笔方式随孩子的成长变化
樱花怎么描写?不同场景下的樱花描写技巧及例句!