资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

【海外智库观察】人工智能发展的最新现状与前沿趋势

创作时间:

作者:

@小白创作中心

【海外智库观察】人工智能发展的最新现状与前沿趋势

引用

腾讯

https://new.qq.com/rain/a/20240513A0AF1Y00

2023年，人工智能领域取得了突破性进展。从基础模型到机器人技术，从AI代理到科学医学应用，AI正在以前所未有的速度改变着我们的生活。本文将为您详细解读斯坦福大学HAI发布的两份重要报告，带您了解AI发展的最新现状与前沿趋势。

人工智能前沿研究的五大趋势

2024年4月15日，HAI发布其AI（Artificial Intelligence, AI）指数研究经理兼主编Nestor Maslej编写的文章《AI指数：人工智能前沿研究的五个趋势（AI Index: Five Trends in Frontier AI Research）》。文章指出，人们总围绕大语言模型（Large Language Model, LLM），而往往忽视了除LLM之外的前沿人工智能研究取得的巨大进步，并根据最近发布的《人工智能指数的综合报告》总结了2023年人工智能在基础模型、机器人技术、人工智能代理、科学和医学五个领域取得的进展。

1. 基础模型更加灵活

人工智能的基础模型在2023年发展得更加灵活。一方面，人工智能基础模型在多个基准测试中达到了新标准：在衡量大语言模型性能的测试MMLU（Mean Multi-Language Understanding, MMLU）中，谷歌的Gemini Ultra首次超过了人类的基准线；在评估大模型数学能力的基准测试MATH中，一个基于GPT-4的模型获得了接近84%满分的分数，离三次国际数学奥林匹克金牌得主设定的90%标准非常接近，而2022年这一测评结果仅为65%；同样，Midjourney在输出“哈利·波特的超现实主义图像”方面也有了显著的进步。另一方面，人工智能模型变得更加灵活。传统的人工智能模型输出内容的范畴极为有限，比如：擅长阅读理解的语言模型在生成图像方面表现不佳，反之亦然。然而，2023年最新发展的前沿人工智能模型打破了这一约束，比如谷歌的Gemini、OpenAI的GPT-4和Anthropic的Claude-3，展现了多模态的灵活性，其不仅能够处理图像和音频，还能够生成代码。

2. 非语言模型快速发展

非语言模型在2023年中迅速地发展。研究人员利用Transformer架构推动了生成非语言模型的飞速发展，能够生成视频的Emu Video和能够生成音乐的UniAudio则是最新成果，意味着使用者可以用与ChatGPT类似的方法驱动AI模型生成视频和音乐。

3. 机器人技术突飞猛进

受益于语言建模技术的进步，机器人技术在2023年突飞猛进。2023年发布的两款前沿机器人模型，PaLM-E和RT-2，都经过了基于语言和机器人轨迹数据的组合语料库进行的训练。PaLM-E不同于早期的机器人，其能够参与某种程度的推理的操作任务，例如按颜色对积木进行分类，它还具备给图片加标题、生成俳句、讲笑话等功能。而RT-2则擅长于适应并应对新环境。这些机器人助手如若得到进一步开发，将有助于协助使用者完成诸如基本家务等任务。

4. 人工智能代理取得进步

人工智能代理也取得了进步。通过AgentBench、MLAgentBench等半自主操作方面的基准测试，人工智能代理存在充当计算机科学助手的前景，然而，它们仍然在一些更复杂的任务上表现不佳，比如在进行在线购物、管理家庭或独立操作计算机上仍有待提升。

5. AI推动科学医学应用

人工智能推动了GraphCast系统的推出，使之能够在一分钟内提供精确的未来10天天气预报；GNoME能够揭示超过200万个先前被人类研究人员忽视的新晶体结构；AlphaMissence能够成功对大约7100万个可能的错义突变中的89%进行分类。此外，人工智能可以执行人类个体难以应对但却对解决一些最复杂科学问题至关重要的复杂计算。在医学方面，新的研究显示，医生可以利用人工智能更好地诊断乳腺癌、解读X射线，并检测更难以发现的癌症。

2023年人工智能发展现状

2024年4月15日，斯坦福大学以人为本人工智能研究所发布其总编辑Shana Lynch撰写的《AI指数：13张图表中的AI现状（AI Index: State of AI in 13 Charts）》。文章从开源和闭源人工智能模型发展、前沿模型的主要开发者、人工智能领域的领导者、人工智能的投资动向、公众对人工智能的认知等八个领域阐释了了2023年人工智能的发展现状。

1. 开源模型快速发展

人工智能模型呈现开源化趋势。2023年新发布的基础模型数量是2022年发布的两倍多，高达149个。其中，65.7%的模型是开源模型，而在2022年，开源模型在新开发模型中的占比为44.4%，2021年仅有33.3%。

图1：开源模型占比变化

2. 开源模型性能仍落后闭源模型

当前开源模型的性能仍低于闭源模型。研究人员对模型进行了10项基准测试，发现闭源模型实现了24.2%的中值性能优势，开源模型与闭源模型的性能差异范围从GSM8K等数学任务上的差异小至4.0%，到AgentBench等代理任务上的差异高达317.7%。

图2：开源模型与闭源模型性能对比

3. 产业界主导AI模型开发

当前产业界仍是构建和开发AI模型的主要推动者。2023年，72%的新基础模型都由企业开发。具体而言，谷歌是发布模型数量最多的企业，超过了其他的从业者，包括Gemini和RT-2。事实上，自2019年以来，谷歌一直占据基础模型发布数量榜榜首的位置，其一共发布了40个基础模型。究其原因，训练大语言模型成本的指数级增长阻碍了学术界和政府对于人工智能模型的开发。据估计，训练谷歌的Gemini Ultra所需的成本约为1.91亿美元，而训练OpenAI的GPT-4大致需要7800万美元。相比之下，2017年推出的原始Transformer模型的训练成本仅为900美元左右，而这个模型却奠定了几乎所有现代大型语言模型的架构。

图3：各机构发布基础模型数量占比

图4：谷歌发布基础模型数量变化

图5：训练成本变化

4. 美国在AI领域占据主导地位

在当前的人工智能竞争当中，美国居于领先地位。就机器学习模型而言，自2019年以来，美国一直在人工智能模型方面发挥领导作用，其次领先的国家是中国和英国。2023年，美国这一领先优势尤其明显，其模型数量远超其他国家，高达61个。此外，美国的领先地位还表现为其在私人投资方面占据主导地位。2023年，美国的投资额为672亿美元，大约是排名其之后投资最多的国家中国的8.7倍，是英国的17.8倍。从2013年以来的累计投资排行看来，美国仍然居于首位，累计投资额为3352亿美元；其次是中国和英国，分别为1037亿美元和223亿美元。

图6：各国发布模型数量对比

图7：各国累计投资额对比

5. AI能力与人类接近但仍有差距

截至2023年，人工智能在包括阅读理解和视觉推理在内的许多重要的人工智能基准测试中已经达到了人类水平。不过，它在一些基准测试中仅稍逊一筹，比如数学竞赛水平测试。

图8：AI与人类能力对比

6. 生成式AI投资大幅增长

生成式AI领域投资大幅增长，至少占据了人工智能领域私人投资的四分之一。尽管2023年人工智能领域私人投资整体下降，但对生成式人工智能的投资却不降反升，达到252亿美元，这一金额几乎是2022年的9倍，约为2019年的30倍。

图9：生成式AI投资变化

7. 企业广泛应用AI

越来越多的企业在其业务中应用人工智能。调查结果显示，55%的企业表示他们在2023年使用人工智能，而这一比例在2022年为50%，2017年为20%。报告还显示，企业对人工智能的使用集中于自动化、丰富个性化内容和获取新客户方面。

图10：企业AI应用领域

8. 公众对AI就业影响担忧

超过三分之一的民众认为其将被人工智能取代。调查结果显示，包括Z世代和千禧一代在内的年轻一代认为人工智能对他们的影响比像X世代和婴儿潮一代这样的年长一代更为显著。具体而言，66%的Z世代与46%的婴儿潮一代受访者认为人工智能将对他们目前的工作产生重大影响。与此同时，收入较高、受教育程度较高、担任决策角色的个人预见到人工智能对他们的就业产生巨大影响。