问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

李彦宏发布两大AI黑科技,引爆百度世界大会

创作时间:
作者:
@小白创作中心

李彦宏发布两大AI黑科技,引爆百度世界大会

引用
百度
12
来源
1.
https://baike.baidu.com/item/2024%E7%99%BE%E5%BA%A6%E4%B8%96%E7%95%8C%E5%A4%A7%E4%BC%9A/64949259
2.
https://finance.sina.com.cn/tech/digi/2024-09-27/doc-incqqqcv1122491.shtml
3.
https://create.baidu.com/
4.
https://www.sohu.com/a/826102066_380891
5.
https://cloud.baidu.com/product/AMIS/miaoda.html
6.
https://www.guancha.cn/economy/2024_11_12_755107.shtml
7.
https://cti.baidu.com/
8.
https://www.yicai.com/news/102356444.html
9.
http://www.cww.net.cn/article?id=595457
10.
https://create.baidu.com/?lng=zh
11.
https://ai-bot.cn/miaoda/
12.
http://www.news.cn/tech/20241112/041eaddb008049fdb7a9b93d7713c4f1/c.html

11月12日,百度创始人李彦宏在2024百度世界大会上发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。这些技术不仅解决了大模型在图片生成上的幻觉问题,还实现了无需编写代码即可实现复杂任务的功能。

检索增强的文生图技术:解决图片生成的“幻觉”难题

“过去24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”李彦宏在演讲中表示。幻觉问题是大模型广泛应用的最大限制之一,而解决文本生成幻觉问题背后的技术就是RAG(检索增强生成)。目前,文字层面的RAG已经做得很好,基本让大模型消除了幻觉;但在图像等多模态方面,和RAG的结合还不够,这也是百度希望重点突破的方向。

基于此,百度开发了检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片。“整体效果远远超过文生图原生系统,去除了机器味儿”。

例如,通过文心iRAG技术,无论是特定型号汽车的车型车标,还是作为背景的长城,均未出现错误或变形的幻觉问题。在另一张“爱因斯坦环游世界”图片中,爱因斯坦和各个背景景点的结合也与真实世界高度相似,质感接近照片。

iRAG技术极大地提高了AI生成图片的可用性。比如在品牌宣传上,以前拍一组海报动辄大几十万,但现在的创作成本接近于0。简单而言,文心iRAG的商业价值体现在:无幻觉、超真实、没成本,立等可取。此外,在影视作品、漫画作品、连续画本、海报制作等应用场景中,iRAG都可以大幅降低创作成本。

“秒哒”:开启无代码开发新时代

在百度世界大会上,李彦宏还发布了当天的One More Thing——无代码工具“秒哒”,一款不需要写代码就能实现应用开发的软件。它涵盖无代码编程、多智能体协作以及多工具调用等特点,只需说说话,就能构建出各种应用。

“秒哒”由大模型直接生成代码,不需要人写一行代码。它门槛很低,人人可上手;多智能体协作,是基于文心大模型的思考和规划能力,实现对不同智能体的调度和编排;多工具调用,是通过文心大模型的工具调用能力,可调用网页检索、iRAG、地图API等各类型工具。

在现场演示中,李彦宏展示了如何通过“秒哒”快速搭建活动报名系统:只要用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥多个智能体协作,完成报名系统的开发。在演示过程中,小组长、策划、小编、程序员和质检员五个智能体互相协作,协同完成策划、内容和开发等各种工作,还能自动识别bug、调用各种工具。李彦宏表示,这是“迄今为止人类历史上最复杂的多智能体协作工具”。

“一个人通过自然语言交互,就可以完成一套系统的搭建,除了上面展示的邀请系统,还可以做任意场景下的各种应用,应用的复杂度也会随着我们技术的提升不断提升。”李彦宏总结说,这意味着每个人自己就能指挥多个智能体来协同完成任务,“只要有想法,你就可以心想事成,我们将迎来一个前所未有的,只靠想法就能赚钱的时代。”

智能体:AI应用的下一个爆发点

“今天,全球所有顶尖科技公司都在关注智能体,但像百度这样把智能体作为最重要战略方向的公司并不多。”李彦宏表示,就像PC时代的网站、移动时代的自媒体账号,在AI原生时代,智能体将成为内容、服务和信息的新载体。

他以公司类智能体举例,在传统的PC官网模式下,企业只能静态地展示公司介绍、产品参数,但缺失主动推荐、及时响应和一对一服务能力;而公司智能体则可以根据顾客的需求推荐相应产品,在服务方面,也能更直接、快速地响应需求,能大幅地提升互动营销的效率。比亚迪的官方智能体上线后,销售转化率提升119%,联想AIPC智能体的9月互动率提升89%。

此外,李彦宏展示了角色、工具和行业等多类智能体的特色功能及使用场景。例如百度文库和百度网盘联合打造的工具类智能体“自由画布”,让用户可以在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。再比如,法律智能体“法行宝”,已回答用户1660万个法律问题,不仅能像专业律师一样给出解答,还能计算法律赔偿金额、撰写法律文书,并推荐适配律师。

“智能体是AI应用的最主流形态,即将迎来它的爆发点。”在李彦宏看来,智能体的门槛低、天花板高,既能让人人都上手,又能做出复杂强大的应用。当天,他展示了文心智能体平台的TOP100智能体,既有农民院士智能体等角色类,也有工具、行业、职场、情感、娱乐等各类场景的智能体。目前,文心智能体平台已吸引了15万家企业和80万名开发者。

截至11月初,百度文心大模型的日均调用量超15亿,相较5月披露的2亿,增长7.5倍,相较一年前首次披露的5000万次,更是增长约30倍。李彦宏表示“这个增速超出预期”,说明AI是真需求。他感慨,这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发。

这些创新成果不仅展示了百度在AI技术领域的持续领先地位,也进一步推动了AI技术在信息技术领域的应用和发展,为各行各业带来了新的机遇和可能性。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号