DeepSeek成科技热议话题：国产大模型如何站在巨人肩上

创作时间:

作者:

@小白创作中心

DeepSeek成科技热议话题：国产大模型如何站在巨人肩上

引用

中华网

https://3g.china.com/act/news/10000169/20250205/47930407.html

春节期间，中国国产大模型DeepSeek成为科技领域的热议话题。深度求索公司发布的推理大模型DeepSeek-R1不仅在业界引起轰动，更登顶苹果中国区和美国区应用商店免费App下载排行榜。近日，英伟达、亚马逊和微软等国际巨头也宣布接入DeepSeek-R1，显示出这一国产AI大模型的强劲实力。

DeepSeek的成功标志着AI技术的一次重要突破。它不仅达到了国际先进水平，还因其高可用性和完成度吸引了大量普通用户的关注。此外，DeepSeek展示了国产大模型的能力，并有可能追赶甚至超越世界领先水平。DeepSeek的R1模型训练成本仅为557.6万美元，远低于OpenAI的GPT模型所需的1亿美元。

面对广泛好评，深度求索创始人梁文锋表示，他们的成就离不开开源社区的支持。开源社区允许用户利用源代码进行修改和学习，促进了技术共享和技术生态的繁荣。开源策略不仅能吸引全球开发者和研究者的关注，还能帮助竞争中的弱势一方扭转局面。计算机行业的竞争通常表现为封闭生态与开放开源生态之间的较量。

开源已成为推动AI发展的关键因素。Meta首席人工智能科学家杨立昆指出，DeepSeek的成功更多是开源代码超越私有模式的结果。Meta在AI开源方面发挥了重要作用，其开源项目如LLaMA和图像分割模型Segment-Anything覆盖了多种模态和场景。2023年7月，Meta发布的LLaMA2将开源协议从“仅研究可用”改为“免费可商用”，进一步改变了大模型的竞争格局。

最近，Meta又开源了多个AI项目，包括图像分割模型SAM 2.1、多模态语言模型Spirit LM等，提升了AI在图像处理和语音识别领域的能力。尽管开源促进了AI的发展，但硬件逐渐走向封闭的趋势可能对软件开源带来挑战。因此，中国AI界需要通过创新和开放来应对这一变化，正如DeepSeek也开源了自己的大模型。

热门推荐

东莞至重庆交通方式全解析：高铁、飞机、汽车如何选择最合适