问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

5人3小时开源复刻Manus,无需排队的AI智能体来了

创作时间:
作者:
@小白创作中心

5人3小时开源复刻Manus,无需排队的AI智能体来了

引用
CSDN
1.
https://blog.csdn.net/cf2suds8x8f0v/article/details/146109456

全球首款通用智能体Manus一经推出便迅速走红,如今已有开源复刻版OpenManus面世。一个完全免费、无需排队等待的开源版本仅需5人3小时便开发完成。本文将详细介绍OpenManus的技术架构及其对理解Manus实现路径的启示。


图源:量子位

开源复刻版OpenManus的技术架构

从开源项目OpenManus的实现路径中,我们可以一窥Manus可能的实现方式。尽管当前Manus的具体技术细节(如使用的模型、Agent框架等)尚未公开,但OpenManus的实现为我们提供了一些线索。

OpenManus的核心架构基于三大关键要素:

  1. 模块化Agent系统:开发者可以根据需求自由组合不同的功能模块,创造出独特的AI助手。在OpenManus中,不同分工的Agent协同完成需求理解、规划和执行等任务。例如,主代理负责理解用户需求并进行任务分配,PlanningAgent负责将复杂任务拆解为可执行步骤,而ToolCallAgent则负责调用各类工具。

  2. 实时反馈机制:OpenManus的思维过程是公开透明的,能够实时展示其如何思考和规划执行过程。这种设计为人类在适当时候进行干预提供了可能,有助于提升任务完成质量。

  3. 强大的工具链:为了完成复杂任务,OpenManus配备了一系列工具,包括浏览器自动化、代码执行器、文件处理等。这些工具不是孤立的模块,而是需要协同设计,共同完成任务。

整体而言,这类多智能体系统的架构可以概括为:底层由各类大语言模型构成,中间层通过多智能体协作拆解任务,执行层则通过调用各类API接口完成具体操作。

开发团队与技术沉淀

OpenManus的开发团队仅用3小时就完成了复刻,其中核心系统仅用1小时就开发完成。这一快速开发能力得益于团队在MetaGPT项目上的技术积累。MetaGPT是一个多智能体框架,通过将不同角色分配给GPT模型,形成一个协作性的"软件公司"。

核心开发团队成员均来自MetaGPT团队,他们将浏览器工具链与MetaGPT框架结合,快速开发出了OpenManus。团队成员包括:

  • 梁新兵:华东师大毕业,参与过Data Interpreter项目开发
  • 向劲宇:西南交通大学应用物理系本科,曾获得阿里巴巴数学竞赛AI赛道全球第二名
  • 张佳钇:中国人民大学高瓴人工智能学院本科毕业,现为港科大(广州)在读博士
  • 于兆洋:张佳钇的同级同学
  • 洪思睿:MetaGPT和Data Interpreter两篇论文的共同一作,DeepWisdom高级研究员

对Manus"套壳风波"的新解读

OpenManus的出现为理解Manus的"套壳风波"提供了新的视角。此前,Manus因与Monica的相似性而被质疑"套壳"。然而,从OpenManus的开发过程来看,许多模块都是基于已有开源项目实现的,实现不同模块的统筹和调度绝非易事。

开源社区的意义在于让后来的开发者能够站在前人的肩膀上,各大模型厂商提供API的目的也是为了让开发者能够开发新的应用。因此,是否"套壳"并不是问题的关键,关键是产品能否产生实质性的生产力提升。

开源地址

https://github.com/mannaandpoem/OpenManus

参考链接

[1]https://x.com/didiforx/status/1897675038972883408
[2]https://www.sohu.com/a/827134153_121798711
[3]https://modelscope.cn/studios/AI-ModelScope/SPO

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号