问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

从LLM到LAM：大型动作模型的革命性进展

创作时间:

作者:

@小白创作中心

从LLM到LAM：大型动作模型的革命性进展

引用

1

来源

1.

https://www.cnblogs.com/sddai/p/18627859

Large Action Models（LAMs）是AI领域的一个重要发展方向，它突破了传统LLMs（大语言模型）在文本生成和回复方面的局限，致力于在物理和数字环境中执行实际动作。本文将详细介绍LAMs的核心概念、关键特性、开发步骤以及面临的挑战，为AI研究者和从业者提供全面的参考和指导。

核心观点

LAMs是AI发展的重要方向，能够将AI从被动语言理解转变为主动任务完成，在人工智能发展进程中具有重要意义。
LAMs通过在物理和数字环境中执行动作，实现了从语言交互到实际行动的跨越，是对LLMs的重大拓展。
开发LAMs需要系统的方法，包括数据收集、模型训练、环境集成、评估等多个关键步骤，以确保其在实际应用中的有效性和可靠性。

LAMs的特性

多模态输入理解：能解读自然语言请求、语音命令、图像或视频等多样化输入，理解用户意图。
动作生成：可将用户意图转化为在特定环境中可执行的动作，如操作GUI元素、调用API、物理操作或生成代码等。
动态规划与适应：能分解复杂任务，根据环境变化调整计划和动作，确保任务执行的灵活性和有效性。
专业化与高效性：专注于特定领域或任务，编码环境知识，提高准确性和适应性，降低计算开销，适用于资源受限环境。

LAMs的开发步骤

数据收集与准备：采用任务-计划收集和任务-动作收集两阶段方法，获取高质量训练数据，确保模型能理解任务并执行动作。
模型训练：分四个阶段，从学习结构化任务计划到模仿专家演示，再到自我探索和奖励优化，逐步提升模型能力。
离线评估：使用离线数据集评估模型在规划和决策能力方面的表现，包括任务成功率、精度、召回率等指标。
集成与落地：将训练好的LAM集成到代理系统（如UFO）中，使其能与环境交互，执行任务并根据反馈调整。
在线评估：在真实环境中评估LAM性能，确保其在准确性、效率和完成任务能力等方面符合预期。

面临的挑战与未来方向

安全风险：LAMs执行现实世界动作可能带来安全隐患，需开发安全机制，如错误检测、回滚和故障安全系统。
伦理与监管：部署LAMs引发伦理和监管问题，需建立透明模型架构、明确监管框架和伦理准则，确保公平、负责。
可扩展性、通用性和适应性：当前LAMs针对特定环境，扩展性、通用性和适应性受限，需采用新技术提高其在不同环境中的性能。

研究贡献与意义

提供LAMs的全面框架，包括概念、开发步骤和评估方法，为从业者提供实践指导。
强调LAMs在实现人工智能从语言理解到实际行动转变中的关键作用，推动AI技术向更智能、实用方向发展。
通过案例研究和实验分析，展示LAMs的潜力和优势，为未来研究和应用提供基础。

数据样例

数据构建：使用GPT-4提取和格式化任务及计划，将历史搜索查询合成完整用户请求，生成包含任务描述和计划的结构化JSON样本，如

{
  "task_id": "word_032",
  "task": "Add a border to a page in Word",
  "plan": [
    "Go to Design> Page Borders.",
    "Make selections for how you want the border to look.",
    "To adjust the distance between the border and the edge of the page, select Options. Make your changes and select OK.",
    "Select OK."
  ]
}

工程化框架

UFO是一个专注于UI的多智能体框架，可以在Windows操作系统中无缝导航和操作单个或多个应用程序，以满足用户请求。更多详情请访问：

论文链接

LAMs相关研究论文

热门推荐

长期食用过热食物的健康警钟

长期食用过热食物的健康警钟

网络“烂梗”泛滥会不会影响青少年“好好说话”？

网络“烂梗”泛滥会不会影响青少年“好好说话”？

推荐10款Steam上好玩的冷门单机游戏

推荐10款Steam上好玩的冷门单机游戏

股票高估值是什么意思？股票高估值的判断标准是什么？如何应对股票高估值的情况？

股票高估值是什么意思？股票高估值的判断标准是什么？如何应对股票高估值的情况？

电容器件的手册解读以及选型经验

电容器件的手册解读以及选型经验

职工医保缴纳年限及其政策解析

职工医保缴纳年限及其政策解析

如何进行涨停板股票的复盘分析？这种分析对后续投资有哪些启示？

如何进行涨停板股票的复盘分析？这种分析对后续投资有哪些启示？

开封必吃十大馆子！本地人私藏老店清单，最后一家连央视都来打卡

开封必吃十大馆子！本地人私藏老店清单，最后一家连央视都来打卡

月老灵签84签：花开堪折直须折，珍惜时光把握机会

月老灵签84签：花开堪折直须折，珍惜时光把握机会

艾灸后鼻窦炎黄鼻涕增多？原因分析与处理建议

艾灸后鼻窦炎黄鼻涕增多？原因分析与处理建议

鹦鹉怎么训练说话

鹦鹉怎么训练说话

Windows配置NTP时间同步

Windows配置NTP时间同步

改进混凝土：“绿色水泥”在芬兰蓬勃发展

改进混凝土：“绿色水泥”在芬兰蓬勃发展

鸟类声音的奥秘被揭开！科学家发现鸟类多样鸣叫的惊人原因

鸟类声音的奥秘被揭开！科学家发现鸟类多样鸣叫的惊人原因

电影大片：不以长短论英雄

电影大片：不以长短论英雄

《伤寒论》千古第一方——桂枝汤：临床应用体悟总结 | 思维导图版

《伤寒论》千古第一方——桂枝汤：临床应用体悟总结 | 思维导图版

电吹管演奏技巧在作品中的优势体现（详细科普）

电吹管演奏技巧在作品中的优势体现（详细科普）

山峰也需要“充电” 让它们轮流休息

山峰也需要“充电” 让它们轮流休息

麦粒肿叫什么？一文读懂睑腺炎的病因、症状与治疗

麦粒肿叫什么？一文读懂睑腺炎的病因、症状与治疗

微信的转账记录删除了还能恢复吗？微信支付记录删除后怎么恢复

微信的转账记录删除了还能恢复吗？微信支付记录删除后怎么恢复

半月板损伤程度鉴定标准及治疗方法

半月板损伤程度鉴定标准及治疗方法

超声波传感器：未来发展趋势与技术前沿

超声波传感器：未来发展趋势与技术前沿

探索月老灵签的神秘力量，揭开爱情之谜

探索月老灵签的神秘力量，揭开爱情之谜

试用期劳动合同范本：明确双方权利义务，保障双方利益

试用期劳动合同范本：明确双方权利义务，保障双方利益

成都玉林路的尽头，是掩映在人间烟火里的“武侯”

成都玉林路的尽头，是掩映在人间烟火里的“武侯”

版权保护难题：影视剧刚上线网上就现盗版资源，AI时代文生视频引发新课题

版权保护难题：影视剧刚上线网上就现盗版资源，AI时代文生视频引发新课题

学车要多久？一般2-3个月，最快26天拿证！

学车要多久？一般2-3个月，最快26天拿证！

最新报告揭示婚恋观念演变：青年群体的多元视角与社会反响

最新报告揭示婚恋观念演变：青年群体的多元视角与社会反响

白水晶的鉴别方法有哪些白水晶的真假怎么鉴别？

白水晶的鉴别方法有哪些白水晶的真假怎么鉴别？

长豆角的种植方法和管理技术（从播种到收获全程指导，让您的豆角丰收无忧）

长豆角的种植方法和管理技术（从播种到收获全程指导，让您的豆角丰收无忧）

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号