AI Agent技术栈全解析:从模型服务到托管服务
创作时间:
作者:
@小白创作中心
AI Agent技术栈全解析:从模型服务到托管服务
引用
CSDN
1.
https://blog.csdn.net/2401_85375151/article/details/145125186
2024年,AI技术从简单的聊天机器人向更复杂的智能体转变。AI agent能够自主行动、执行任务,并与外部工具交互,这使得它们背后的技术栈与传统的LLM技术栈有很大的不同。本文将为您详细解析AI agent的技术栈,帮助您了解这个快速发展的领域。
从 LLM 到 Agent:一场深刻的进化
在2022和2023年,我们见证了LLM框架和SDK的爆发,如LangChain和LlamaIndex。与此同时,LLM的使用也变得更加方便,无论是通过API调用还是自行部署(比如vLLM和Ollama)。
然而,到了2024年,大家的目光开始转向更高级的AI "agent"。这个概念虽然早在AI领域就存在,但在ChatGPT时代,它有了新的内涵:能够自主行动、执行任务,并与外部工具交互的LLM。
这种转变意味着,我们需要一套全新的技术栈来支撑agent的发展。
Agent 技术栈:核心差异在哪里?
Agent不仅仅是会聊天的大模型,它们更像是具备一定自主性的智能体。它们需要管理自己的状态(例如,对话历史和记忆)、调用各种工具,并且安全执行。这使得agent的技术栈和传统的LLM技术栈有很大的不同。
让我们从底层到顶层,逐一剖析agent技术栈的关键组成部分:
1. 模型服务:AI 的大脑
- 核心:LLM。这是AI agent的核心动力。
- 服务方式:通过推理引擎提供服务,通常是付费/自己部署API。
- 主要玩家:
- 闭源模型:OpenAI和Anthropic领跑。
- 开源模型:Together.AI、Fireworks和Groq等提供商开始崭露头角,提供基于Llama 3等模型的服务。
- 本地部署:vLLM成为生产级GPU服务的主流选择,而Ollama和LM Studio则深受个人爱好者的喜爱。
2. 存储:记忆的基石
- 核心:持久化状态,如对话历史、记忆和外部数据。
- 关键技术:
- 向量数据库:Chroma、Weaviate、Pinecone、Qdrant和Milvus等用于存储agent的“外部记忆”,应对大容量数据。
- 传统数据库:Postgres通过pgvector扩展也开始支持向量搜索。
- 为何重要?Agent是有状态的,需要长期存储和检索信息。
3. 工具与库:能力的扩展
- 核心:使agent能够执行各种任务的“工具”(或“函数”)。
- 调用方式:通过LLM生成的结构化输出(例如,JSON对象)指定要调用的函数和参数。
- 安全执行:使用沙箱(如Modal和E2B)来确保工具执行的安全性。
- 工具生态:
- 通用工具库:Composio等。
- 专用工具:Browserbase(网页浏览)、Exa(网页搜索)等。
- 为何重要?工具扩展了agent的能力边界,让它们能够完成更复杂的任务。
4. Agent 框架:编排智能的指挥中心
- 核心:负责编排LLM调用,管理agent状态。
- 关键特性:
- 状态管理:如何保存和加载agent状态,例如对话历史和记忆。
- 上下文窗口:如何将状态信息“编译”到LLM的上下文窗口中。
- 跨agent通信:如何实现多agent之间的协作。
- 内存管理:如何应对LLM有限的上下文窗口,管理长期记忆。
- 开源模型支持:如何让agent更好地利用开源模型。
- 热门框架:Llama Index、CrewAI、AutoGen、Letta、LangGraph等。
- 为何重要?框架决定了agent的运行方式和效率。
5. Agent 托管与服务:未来趋势
- 核心:将agent作为服务进行部署,通过API进行访问。
- 当前痛点:状态管理、安全工具执行以及规模化部署是难题。
- 未来展望:未来将会出现标准化的Agents API,让agent的部署更加便捷。
- 为何重要?这将使agent从原型走向真正的应用。
未来已来:agent 技术栈正在高速发展
Agent技术栈整体仍然非常年轻,但它正在以惊人的速度发展。未来的agent将会更加智能、更加自主,它们将会在各行各业发挥重要的作用。
热门推荐
孩子摔跤把牙摔出来了,正确处理还“有的救”吗?
什么是衍射光栅?衍射光栅的应用及原理
了解股票交易单位的基本知识
减重高达25.5%!JAMA子刊:3个方法,助力减肥更显著、更持久
电流回路是分析电路图的基础,看看这个电路你会更明白
如何正确快速的学习前端
如何系统学习前端框架开发:从入门到进阶
如何构建高效的CI/CD流水线:自动化部署与测试的最佳实践
1升油等于多少公斤?一文详解油品密度与重量换算
电磁兼容性EMC实验室:构建与测试的关键要素
绵阳市TOP10热门学区房(小区)排名一览
思维导图怎么制作?试试这几种思维导图制作方法
香雪海“赏梅专线”明日开通,2条线路详解让你轻松打卡梅花胜地
德国的经济衰退警报与结构性挑战
早餐不能吃“小米粥”?提醒:不仅小米粥,6种早餐,请撤下饭桌
这5种杂粮是升糖大户,千万别吃!科学选杂粮,记住这4点?
扫码挪车的原理是什么?真的能保护车主的隐私安全吗?
什么股会被st?股票被st的原因和影响有哪些?
中科院团队突破顺酐制备关键技术,打破国际垄断
在即墨,邀您共赴这场美食与文化之旅
你,有自己的人设吗?
如何与婆婆和睦相处(以尊重为前提)
古代铜钱雕母与普通钱币有什么区别
汽车的经济时速是多少?高速如何开最省油?看这篇文章你就明白了
人工智能打开网络微短剧市场新空间
什麼是面肌痙攣?
安全提示 | 冬季交通安全出行锦囊——非机动车篇!
汽车向左跑偏的调整方法有哪些?怎样避免汽车出现跑偏的情况?
胎儿缺氧的医学解析与应对策略
胎儿急性缺氧的症状及应对措施