资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

盘点2024年AI大事件：技术突破与商业竞争交织的一年

创作时间:

作者:

@小白创作中心

盘点2024年AI大事件：技术突破与商业竞争交织的一年

引用

CSDN

https://m.blog.csdn.net/weixin_37352936/article/details/144899478

2024年，人工智能（AI）领域经历了前所未有的快速发展，从模型的迭代升级到技术的突破创新，从商业竞争到科研领域的重大突破，这一年见证了AI技术的飞速进步。以下是2024年AI领域的重要事件盘点：

谷歌推出Gemini 1.5 Pro

2024年2月15日，谷歌推出了Gemini 1.5 Pro，创下了最长上下文窗口的新记录。该模型的上下文窗口可达100万token，理论极限甚至可以达到1000万token。这意味着它可以处理1小时的视频、11小时的音频、超过30,000行代码的代码库，或者超过700,000个单词的信息。

OpenAI推出首个文生视频模型Sora

2024年2月16日，OpenAI推出了首个文生视频模型Sora，被视为革命性的技术突破。这一技术的推出标志着"AI视频生成元年"的开启。尽管Sora的正式版直到12月才发布，但这一年中，包括可灵、即梦、海螺、混元、Runway、Pika、Veo2、PixVerse在内的多个视频生成模型相继发布，推动了整个行业的发展。

Anthropic发布Claude3全家桶

2024年3月14日，Anthropic发布了Claude3全家桶，这一突破性进展使得这家初创公司超越了OpenAI。这表明在大模型领域，技术领先地位并非一成不变，竞争正在推动技术的不断进步。

英伟达发布新一代Blackwell GPU架构

2024年3月18日，英伟达在GTC大会上发布了新一代Blackwell GPU架构。这一架构的发布不仅展示了GPU技术的最新进展，也体现了英伟达在AI领域的领导地位。英伟达用了8年时间将单卡训练性能提升了1000倍，这一成就被誉为"老黄定律"的登基。2024年6月，英伟达超越微软，历史性地登上了全球市值最高公司的宝座，完成了长达30多年的逆袭之旅。

DeepSeek发布开源模型V2

2024年5月7日，DeepSeek V2荣登全球开源模型榜首，成为最强的开源MoE语言模型。该模型主打低训练成本和更高效的推理性能，计算量仅为Llama-3 70B的1/5，GPT-4的1/20，API价格只有GPT-4-Turbo的百分之一。随后，国内众多云厂商纷纷降价，推理算力价格下降了90%以上，掀起了一场价格战。

谷歌DeepMind推出AlphaFold3

2024年5月9日，谷歌DeepMind推出了全新的生命分子结构预测模型AlphaFold3。该模型将预测范围从蛋白质结构扩展到大部分生命分子（如DNA和RNA等），准确率提高了一倍，预计将打开超过1000亿美元的药物研发市场，帮助人类进一步探究"生命的终极秘密"。

OpenAI发布GPT-4o

2024年5月14日，OpenAI发布了GPT-4o，具备多语言和多模态（如文本、图像、音频等）的处理能力。该模型在情感表达、理解和记忆方面表现出很强的能力，实时语音对话的反应时间平均仅为320毫秒，达到了人类水平。这一突破预示着人人都能拥有AI个人助理的时代即将到来。

Anthropic发布Claude 3.5 Sonnet

2024年6月，Anthropic发布了Claude 3.5 Sonnet，10月又推出了升级版，支持像人一样操控计算机，开启了人机交互的新范式。Anthropic在这一年三次超越OpenAI，成为了OpenAI最强劲的竞争对手。

Meta发布Llama 3.1-405B开源模型

2024年7月23日，Meta发布了Llama 3.1-405B开源模型，标志着开源模型进入了一个全新的时代，可以与闭源模型平分秋色。领先的开源模型不仅为更多公司提供了发展红利，也大大降低了AI开发的门槛，推动了技术的普及。

OpenAI发布o1-preview

2024年9月12日，OpenAI发布了o1-preview。该模型在物理、生物、化学等领域的能力首次超过博士水平，成为第一个具备真正通用推理能力的大模型。它革命性地引入了基于强化学习的内化思维链学习，让人们看到了通往AGI（通用人工智能）的曙光。

诺贝尔物理学奖和化学奖授予AI科学家

2024年10月，诺贝尔物理学奖和化学奖都颁给了AI科学家，这标志着AI技术在科学研究中的重要地位得到了认可，AI正在给所有科学带来变革。获奖者包括物理学奖的John Hopfield和Geoffrey Hinton，化学奖的Demis Hassabis和John Jumper（以及David Baker）。

李飞飞成立World Labs

2024年9月13日，李飞飞宣布成立World Labs，并亲自担任CEO，旨在探索空间智能。2024年12月3日，World Labs推出了首个"空间智能"模型，该模型能够根据一张图像生成一个遵循基本物理规则的3D物理世界，用户可以在其中实时自由移动。

特斯拉FSD V13

2024年12月，特斯拉推送FSD V13，迎来重大能力升级，相比V12.1提升至少150倍。特斯拉有望在2025年超越人类驾驶能力，率先走向L4级自动驾驶。

谷歌DeepMind推出Gemini 2.0

2024年12月11日，Gemini 2.0 Flash的实验版本正式亮相，是Gemini 2.0系列的第一个模型，也是当前主力模型。2.0 Flash在关键基准测试中以两倍的速度超越了1.5 Pro，支持图像、视频、音频等多模态输入，可生成图文混合内容和多语言TTS音频。模型原生支持Google搜索、代码执行及第三方API调用等工具链能力。

OpenAI推出o3

2024年12月21日，OpenAI在年底最后一天推出了o3。这一模型彻底击败了原有的人工通用智能评估基准，再次改变游戏规则，碾压全场。o3在极短的时间内证明了AI的进步，表明仅仅依赖于简单的扩大模型规模和增加训练数据是不够的，架构创新也同样重要，为未来AGI的下一步探索指明了方向。

DeepSeek发布V3模型

2024年12月26日，DeepSeek发布了V3模型，不仅在全球开源模型中排名第一，而且性能比肩世界顶尖模型GPT-4和Claude-3.5-Sonnet。V3模型的训练成本仅为558万美元，是Llama 3 405B的1/11，不到GPT-4的1/10。这一成就证明了大模型预训练仍有巨大的优化空间，DeepSeek开辟了一条在有限资源下实现技术追赶和超越的新路径，为中国人工智能的技术发展提供了新的思路和解决方案。

2024年见证了AI领域的重大突破和快速发展，从模型的迭代升级到技术的突破创新，从商业竞争到科研领域的重大突破，这一年见证了AI技术的飞速进步。这些进展不仅推动了AI技术的发展，也为未来的科技创新和产业发展奠定了坚实的基础。