DeepSeek成科技热议话题:国产大模型如何站在巨人肩上
DeepSeek成科技热议话题:国产大模型如何站在巨人肩上
春节期间,中国国产大模型DeepSeek成为科技领域的热议话题。深度求索公司发布的推理大模型DeepSeek-R1不仅在业界引起轰动,更登顶苹果中国区和美国区应用商店免费App下载排行榜。近日,英伟达、亚马逊和微软等国际巨头也宣布接入DeepSeek-R1,显示出这一国产AI大模型的强劲实力。
DeepSeek的成功标志着AI技术的一次重要突破。它不仅达到了国际先进水平,还因其高可用性和完成度吸引了大量普通用户的关注。此外,DeepSeek展示了国产大模型的能力,并有可能追赶甚至超越世界领先水平。DeepSeek的R1模型训练成本仅为557.6万美元,远低于OpenAI的GPT模型所需的1亿美元。
面对广泛好评,深度求索创始人梁文锋表示,他们的成就离不开开源社区的支持。开源社区允许用户利用源代码进行修改和学习,促进了技术共享和技术生态的繁荣。开源策略不仅能吸引全球开发者和研究者的关注,还能帮助竞争中的弱势一方扭转局面。计算机行业的竞争通常表现为封闭生态与开放开源生态之间的较量。
开源已成为推动AI发展的关键因素。Meta首席人工智能科学家杨立昆指出,DeepSeek的成功更多是开源代码超越私有模式的结果。Meta在AI开源方面发挥了重要作用,其开源项目如LLaMA和图像分割模型Segment-Anything覆盖了多种模态和场景。2023年7月,Meta发布的LLaMA2将开源协议从“仅研究可用”改为“免费可商用”,进一步改变了大模型的竞争格局。
最近,Meta又开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM等,提升了AI在图像处理和语音识别领域的能力。尽管开源促进了AI的发展,但硬件逐渐走向封闭的趋势可能对软件开源带来挑战。因此,中国AI界需要通过创新和开放来应对这一变化,正如DeepSeek也开源了自己的大模型。