资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

DeepSeek AI技术突破：低成本模式引发投资界新风潮

创作时间:

作者:

@小白创作中心

DeepSeek AI技术突破：低成本模式引发投资界新风潮

引用

钛媒体

等

来源

https://www.tmtpost.com/7439818.html

https://blog.csdn.net/AIBigModel/article/details/145380807

https://finance.sina.com.cn/tech/csj/2025-02-05/doc-ineimcym2092393.shtml

https://www.qbitai.com/2025/02/250758.html

https://m.douban.com/note/869098583/?from=author

https://finance.sina.com.cn/wm/2025-01-27/doc-inehmenz1136044.shtml

https://securitybrief.co.uk/story/deepseek-ai-challenges-chatgpt-with-low-cost-innovation

https://www.shine.cn/news/world/2501299481/

https://www.coface.com.cn/news-economy-and-insights/deepseek-sends-shockwaves-across-ai-industry-and-financial-markets

10.

https://53ai.com/news/finetuning/2025012520749.html

11.

https://www.bbc.com/future/article/20250131-what-does-deepseeks-new-app-mean-for-the-future-of-ai

12.

https://source.washu.edu/2025/02/washu-expert-how-deepseek-changes-the-ai-industry/

2025年1月，中国AI初创公司DeepSeek推出其最新模型R1，这款模型不仅在性能上媲美OpenAI的ChatGPT，更以其惊人的低成本优势震撼了整个AI行业。据微软CEO萨提亚·纳德拉透露，DeepSeek的R1模型已经通过Azure AI Foundry和GitHub向公众开放，这一举动可能彻底改变全球AI技术格局。

技术突破：以更低的成本实现更高的效率

DeepSeek的技术突破主要体现在三个方面：

训练效率的革命性提升

据Qodea首席数据与AI官Devendra Sharma介绍，DeepSeek在训练过程中仅使用了约2000个GPU，而其他大型语言模型（LLM）通常需要8-10万个GPU。这种差异意味着DeepSeek的训练成本仅为其他模型的零头。

低精度计算策略

DeepSeek采用了创新的低精度计算方法，将数值计算的精度从传统的32位降低到8位。这一改变虽然牺牲了一部分计算精度，但却能减少70%的内存使用，显著降低了计算成本。

参数激活机制的创新

与传统模型不同，DeepSeek并没有让所有参数时刻保持活跃状态。而是采用了按需激活的策略，只在必要时调用相关参数。这种做法类似于在需要时才唤醒相关领域的专家，而不是让所有专家时刻待命，从而大大节省了计算资源。

市场影响：引发资本市场震动

DeepSeek的技术突破不仅改变了AI行业的技术格局，也引发了资本市场的剧烈反应。2025年2月5日，A股开盘后，多只与DeepSeek相关的概念股大幅上涨，其中并行科技、安凯微、安恒信息、每日互动、梦网科技和三六零等股票更是直接涨停。

前谷歌CEO埃里克·施密特在《华盛顿邮报》发表专栏文章，将DeepSeek的崛起称为“全球AI竞赛的转折点”。他认为，中国能够在资源较少的情况下与科技巨头竞争，这表明美国需要加大在AI基础设施方面的投资，并推动研究实验室共享训练方法。

开源特性：推动AI生态系统革新

DeepSeek选择将其模型开源，允许用户自由访问和修改代码。这种开放策略可能彻底改变AI行业的竞争格局。历史经验表明，开放架构往往能促进创新并降低市场准入门槛。就像IBM PC兼容标准、Mozilla Firefox浏览器和Android操作系统曾经带来的变革一样，DeepSeek的开源策略可能会为全球AI生态系统注入新的活力。