盘点2024年AI大事件:技术突破与商业竞争交织的一年
盘点2024年AI大事件:技术突破与商业竞争交织的一年
2024年,人工智能(AI)领域经历了前所未有的快速发展,从模型的迭代升级到技术的突破创新,从商业竞争到科研领域的重大突破,这一年见证了AI技术的飞速进步。以下是2024年AI领域的重要事件盘点:
谷歌推出Gemini 1.5 Pro
2024年2月15日,谷歌推出了Gemini 1.5 Pro,创下了最长上下文窗口的新记录。该模型的上下文窗口可达100万token,理论极限甚至可以达到1000万token。这意味着它可以处理1小时的视频、11小时的音频、超过30,000行代码的代码库,或者超过700,000个单词的信息。
OpenAI推出首个文生视频模型Sora
2024年2月16日,OpenAI推出了首个文生视频模型Sora,被视为革命性的技术突破。这一技术的推出标志着"AI视频生成元年"的开启。尽管Sora的正式版直到12月才发布,但这一年中,包括可灵、即梦、海螺、混元、Runway、Pika、Veo2、PixVerse在内的多个视频生成模型相继发布,推动了整个行业的发展。
Anthropic发布Claude3全家桶
2024年3月14日,Anthropic发布了Claude3全家桶,这一突破性进展使得这家初创公司超越了OpenAI。这表明在大模型领域,技术领先地位并非一成不变,竞争正在推动技术的不断进步。
英伟达发布新一代Blackwell GPU架构
2024年3月18日,英伟达在GTC大会上发布了新一代Blackwell GPU架构。这一架构的发布不仅展示了GPU技术的最新进展,也体现了英伟达在AI领域的领导地位。英伟达用了8年时间将单卡训练性能提升了1000倍,这一成就被誉为"老黄定律"的登基。2024年6月,英伟达超越微软,历史性地登上了全球市值最高公司的宝座,完成了长达30多年的逆袭之旅。
DeepSeek发布开源模型V2
2024年5月7日,DeepSeek V2荣登全球开源模型榜首,成为最强的开源MoE语言模型。该模型主打低训练成本和更高效的推理性能,计算量仅为Llama-3 70B的1/5,GPT-4的1/20,API价格只有GPT-4-Turbo的百分之一。随后,国内众多云厂商纷纷降价,推理算力价格下降了90%以上,掀起了一场价格战。
谷歌DeepMind推出AlphaFold3
2024年5月9日,谷歌DeepMind推出了全新的生命分子结构预测模型AlphaFold3。该模型将预测范围从蛋白质结构扩展到大部分生命分子(如DNA和RNA等),准确率提高了一倍,预计将打开超过1000亿美元的药物研发市场,帮助人类进一步探究"生命的终极秘密"。
OpenAI发布GPT-4o
2024年5月14日,OpenAI发布了GPT-4o,具备多语言和多模态(如文本、图像、音频等)的处理能力。该模型在情感表达、理解和记忆方面表现出很强的能力,实时语音对话的反应时间平均仅为320毫秒,达到了人类水平。这一突破预示着人人都能拥有AI个人助理的时代即将到来。
Anthropic发布Claude 3.5 Sonnet
2024年6月,Anthropic发布了Claude 3.5 Sonnet,10月又推出了升级版,支持像人一样操控计算机,开启了人机交互的新范式。Anthropic在这一年三次超越OpenAI,成为了OpenAI最强劲的竞争对手。
Meta发布Llama 3.1-405B开源模型
2024年7月23日,Meta发布了Llama 3.1-405B开源模型,标志着开源模型进入了一个全新的时代,可以与闭源模型平分秋色。领先的开源模型不仅为更多公司提供了发展红利,也大大降低了AI开发的门槛,推动了技术的普及。
OpenAI发布o1-preview
2024年9月12日,OpenAI发布了o1-preview。该模型在物理、生物、化学等领域的能力首次超过博士水平,成为第一个具备真正通用推理能力的大模型。它革命性地引入了基于强化学习的内化思维链学习,让人们看到了通往AGI(通用人工智能)的曙光。
诺贝尔物理学奖和化学奖授予AI科学家
2024年10月,诺贝尔物理学奖和化学奖都颁给了AI科学家,这标志着AI技术在科学研究中的重要地位得到了认可,AI正在给所有科学带来变革。获奖者包括物理学奖的John Hopfield和Geoffrey Hinton,化学奖的Demis Hassabis和John Jumper(以及David Baker)。
李飞飞成立World Labs
2024年9月13日,李飞飞宣布成立World Labs,并亲自担任CEO,旨在探索空间智能。2024年12月3日,World Labs推出了首个"空间智能"模型,该模型能够根据一张图像生成一个遵循基本物理规则的3D物理世界,用户可以在其中实时自由移动。
特斯拉FSD V13
2024年12月,特斯拉推送FSD V13,迎来重大能力升级,相比V12.1提升至少150倍。特斯拉有望在2025年超越人类驾驶能力,率先走向L4级自动驾驶。
谷歌DeepMind推出Gemini 2.0
2024年12月11日,Gemini 2.0 Flash的实验版本正式亮相,是Gemini 2.0系列的第一个模型,也是当前主力模型。2.0 Flash在关键基准测试中以两倍的速度超越了1.5 Pro,支持图像、视频、音频等多模态输入,可生成图文混合内容和多语言TTS音频。模型原生支持Google搜索、代码执行及第三方API调用等工具链能力。
OpenAI推出o3
2024年12月21日,OpenAI在年底最后一天推出了o3。这一模型彻底击败了原有的人工通用智能评估基准,再次改变游戏规则,碾压全场。o3在极短的时间内证明了AI的进步,表明仅仅依赖于简单的扩大模型规模和增加训练数据是不够的,架构创新也同样重要,为未来AGI的下一步探索指明了方向。
DeepSeek发布V3模型
2024年12月26日,DeepSeek发布了V3模型,不仅在全球开源模型中排名第一,而且性能比肩世界顶尖模型GPT-4和Claude-3.5-Sonnet。V3模型的训练成本仅为558万美元,是Llama 3 405B的1/11,不到GPT-4的1/10。这一成就证明了大模型预训练仍有巨大的优化空间,DeepSeek开辟了一条在有限资源下实现技术追赶和超越的新路径,为中国人工智能的技术发展提供了新的思路和解决方案。
2024年见证了AI领域的重大突破和快速发展,从模型的迭代升级到技术的突破创新,从商业竞争到科研领域的重大突破,这一年见证了AI技术的飞速进步。这些进展不仅推动了AI技术的发展,也为未来的科技创新和产业发展奠定了坚实的基础。