资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

OpenAI闭门讨论：今天Agent落地的难点在哪里？

创作时间:

作者:

@小白创作中心

OpenAI闭门讨论：今天Agent落地的难点在哪里？

引用

来源

https://hub.baai.ac.cn/view/44515

AI Agent（智能体）作为人工智能领域的前沿技术，其自主性和智能性使其在各种应用场景中展现出巨大的潜力。然而，随着Agent技术的不断发展和应用，其在实际落地过程中也面临着诸多挑战。本文将探讨AI Agent在落地过程中可能遇到的主要难点，并分析其解决方案。

AI Agent的定义

AI Agent的定义目前存在泛化现象，不同人在讨论时可能指代不同的概念。按照当前的语境，我们可以将ChatGPT视为一种AI应用，它能够理解用户的问题并给出相应的回答。而将经过定制、能够调用外部功能、处理复杂任务的产品称为Agent。

Agent与AI应用（如ChatGPT）之间的主要区别在于"代理性"（agenticness）。如果一个AI系统能够在没有直接人类监督的情况下自主运作，其自主性越高，我们称之为代理性越强。这是一个连续体，不是非黑即白的判断，而是根据其在特定环境中的表现来评估其代理性的程度。

在这种定义下，正统的Agent不仅能够回答问题，还能够自主决定执行哪些操作。它能够通过生成文本来"思考"，做出一些操作，甚至能够创造出更多的AI助手来帮助完成任务。例如，下图展示了一个2年前的Twitter示例，展示了Agent如何通过生成文本来完成任务。

（再补一张2年前，时任OpenAI Dev Rel的Logan的发言）

落地难点

尽管AI Agent看起来很美好，但在实际落地场景中却困难重重，风险多多，出现问题时的责任划分也很麻烦。例如，如果希望让某个Agent帮助微信收款，但它却给别人展示付款码，那么责任归属就变得复杂。

这些问题也是在真正行业落地时需要面对的。以下是AI Agent落地过程中可能遇到的主要难点：

执行效果评估

在商业环境中，确保任何工具的可靠性是基本要求。然而，AI Agent的复杂性在于其工作场景和任务的不确定性。例如，一个在模拟环境中表现优异的自动驾驶车辆，可能因现实世界中不可预测的变量（如天气变化和道路条件）而表现不稳定。我们目前尚缺乏有效的方法来准确评估AI Agent在实际环境中的性能。

危险行为界定

AI Agent在执行高风险操作之前需要获得用户的明确批准。例如，在金融领域，AI执行大额转账前必须得到用户同意。但需要注意，频繁的审批请求可能导致用户出现审批疲劳，从而可能无视风险盲目批准操作，这既削弱了批准机制的效果，也可能增加操作风险。

默认行为确定

当AI Agent遇到执行错误或不确定的情形时，需要有一个默认行为。例如，如果一个客服机器人在不确定用户需求时，其默认行为是请求更多信息以避免错误操作。然而，频繁的请求可能会影响用户体验，因此在保障系统安全性与保持用户体验之间需要找到平衡。

推理透明展示

为了保证AI Agent决策的透明性，系统需要向用户清晰展示其推理过程。举例来说，一个健康咨询机器人应详细解释其提出特定医疗建议的逻辑。但如果推理过程太复杂，普通用户可能难以理解，这就需要在确保透明性和易理解性之间找到平衡。

Agent行为监控

假设一个AI系统用于监控仓库库存，如果监控系统误报，误认为某项商品缺货，进而不断的进货，那么可能导致库存的严重积压，并造成极大损失。于是，我们思考：是否需要另一个Agent来监控这个Agent？成本账怎么算？

Agent作恶追责

考虑一个匿名发布内容的AI Agent，如果其发布了违规内容，要追踪到具体负责的人或机构可能极其困难。这种情况下，建立一个能够确保责任可追溯的系统尤为关键，同时还需要平衡隐私保护和责任追究的需求。

严重事故叫停

想象一个用于自动化工厂管理的AI Agent，在系统检测到严重故障需要立即停机时，不仅需要停止主控系统，还要同步关闭所有从属设备和流程。如何设计一个能够迅速且全面响应的紧急停止机制，以防止故障扩散或造成更大损失，是一项技术和策略上的复杂挑战。

总结

AI Agent作为人工智能领域的前沿技术，其自主性和智能性使其在各种应用场景中展现出巨大的潜力。然而，随着Agent技术的不断发展和应用，其在实际落地过程中也面临着诸多挑战。只有通过不断的研究和实践，才能推动AI Agent技术的健康发展，使其更好地服务于人类社会。

热门推荐

公安榜样｜全省“最美110接警员”郑嘉琳：以坚守书写最美“警”色

日常收支管理和应急存款准备不足青年人金融健康水平引关注

Steam网络不稳定？这三招教你稳定连接，畅玩游戏！

摩托车本实习期最多能扣多少分

河南叶县强拆果园为高速让路，当地成立联合调查组，果园负责人发声

"still"后面的动词形态用法和固定搭配整理

股票走势excel怎么做

欧盟长期居留许可办理全攻略：费用、流程及要求！

万灵山海之境职业令牌哪个好

想学短视频有必要去培训机构学吗

欠款有效期是多长

新能源和续航全都要——30万以内增程式电动汽车如何选择

增程车电池衰减更严重，很多增程车主后悔了：原因不仅是电池衰减

镜片参数—折射率

草木灰的神奇用处，绿色农业中的宝藏

宝宝皮疹的护理方法

俄罗斯核潜艇声呐细节曝光，威慑还是出口，中国技术还赶不上？

宠物催吐，安全方法推荐

又2家农商行领导被查，安徽农信两年内十余名高管“落马”