问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

清华等机构开源主动交互Agent:让AI从被动执行到主动服务

创作时间:
作者:
@小白创作中心

清华等机构开源主动交互Agent:让AI从被动执行到主动服务

引用
CSDN
1.
https://blog.csdn.net/z551646/article/details/144393120

清华大学等机构近日开源了新一代主动交互Agent(ProActive Agent)系统,这一突破性技术有望彻底改变人工智能与人类的交互方式。

主动Agent vs 被动Agent:一场交互革命

当前主流的AI系统,包括ChatGPT在内,都采用被动式交互模式,即用户需要明确下达指令,AI才能执行任务。而清华大学等机构提出的主动Agent范式则颠覆了这一传统模式。


图1:两种人类与智能体交互形式的比对。左侧的被动式Agent只能被动接受用户指令并生成回复,而右侧的主动式Agent 可以通过观测环境主动推断与提出任务。

主动Agent具备“眼中有活、主动帮助”的能力,能够主动观察环境、预判用户需求,像“肚子里的蛔虫”一样,在未被明确指示的情况下主动帮用户解决问题。

主动Agent的潜在应用场景

主动Agent在日常生活中的应用潜力巨大,涵盖个人助理、文件管理、生活服务等多个领域。例如:

  • 个人助理:基于对话自动识别并设置提醒
  • 文件管理:智能识别文件特征并优化管理
  • 生活服务:根据用户习惯主动提供建议
  • 视障人士辅助:主动发现潜在危险并预警
  • 听障人士支持:将周围声音转换为视觉提示
  • 行动障碍辅助:预判用户需求自动控制设备

技术原理与实验研究

主动Agent的技术实现主要包括三个核心组件:

  1. 环境模拟器:通过真实人类数据模拟环境,为智能体提供交互场景。
  2. 主动智能体:基于环境信息预测用户意图,生成任务建议。
  3. 用户智能体:模拟用户行为,对智能体的建议进行反馈。

研究团队还构建了一个名为ProactiveBench的数据集,用于评估不同模型的性能。实验结果显示,经过训练的模型在误报率上有明显下降,但仍然存在提供不必要的帮助的情况。


图2 数据生成过程总览。该过程包含了初始环境与任务设置,事件生成,主动预测,用户判断和行动执行。

开启人机交互新纪元

主动Agent(ProActive Agent)范式的出现,有望将AI从被动的工具转变为具有洞察力和主动帮助的智能协作伙伴,开启人机交互的新纪元。

论文链接:https://arxiv.org/abs/2410.12361

GitHub地址:https://github.com/thunlp/ProactiveAgent

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号