DeepSeek掀翻硅谷?来看看美国科技界对DeepSeek的真实看法
DeepSeek掀翻硅谷?来看看美国科技界对DeepSeek的真实看法
中国科技巨头DeepSeek在美国科技界引发关注,其低成本、高性能的AI模型颠覆了行业传统观念。专家们认为,DeepSeek的成功可能改变AI开发成本结构,促使更多企业和研究机构重新评估资金投入策略。与此同时,科技巨头如Google、Meta、OpenAI对DeepSeek的出现感到恐慌,担忧其挑战现有技术优势。
DeepSeek的技术创新与影响
Lex Fridman的分析
Lex Fridman是MIT的AI研究员和播客主持人,他邀请了半导体分析师Dylan Patel和开源AI倡导者Nathan Lambert来讨论DeepSeek的影响。
DeepSeek的优化策略不是限制模型能力,而是通过改进架构为大规模学习扫清障碍。这种方法类似于为赛车设计符合空气动力学的外形,而不是削弱发动机的性能。DeepSeek的MOE路由机制赋予模型更大的参数选择自由,同时通过动态负载均衡确保计算资源的高效利用。
计算效率的提升永不过时,即使未来算力飞跃,更高效的架构仍然具有重要价值。这意味着在同等资源下,可以探索更多可能性,就像即便有了核聚变能源,人类仍需要研发更高效的电动机。
开源生态的未来
DeepSeek R1的出现标志着一次重要的行业转折。这是首个顶尖模型采用了完全开放的权重,并允许商业用途不受限制,无论是下游应用、合成数据蒸馏,还是其他创新场景都可以自由使用。自ChatGPT推出以来,AI领域从未有过如此彻底的开放模式。
相比之下,Meta的Llama模型虽然被认为是开放的,但其许可证仍然设置了诸多限制。DeepSeek R1则通过更自由的模式,避免了这些问题,为行业提供了真正开放的选择。
然而,开源AI的挑战远不止于许可证问题。开发一个语言模型需要巨大的算力投入和专业团队支持,成本高昂,门槛极高。这使得当前的开源AI更多依赖意识形态驱动,而非市场需求。DeepSeek团队正在尝试通过展示模型处理问题时调用的训练数据来增加透明度,这种做法充满法律风险,但可能为行业树立新的标杆。
Nilay Patel的分析
Nilay Patel是《The Verge》的主编,他与高级AI记者Kylie Robison讨论了DeepSeek对AI行业的影响。
DeepSeek的V3和R1模型以其出色的性能和极低的开发成本,打破了AI开发需要巨额资金和大量计算资源的传统认知。DeepSeek的V3模型在设计上注重效率和成本控制,而R1模型更是凭借其卓越的推理能力,让业界为之震惊。这些成就不仅展示了中国在AI领域的快速进步,更在优化资源使用方面取得了显著成果。
DeepSeek的低成本和高性能对AI行业来说是一次颠覆性的事件。它挑战了行业关于计算资源和资金的传统观念,让人们对AI开发的未来充满了新的期待。DeepSeek的成功表明,AI模型的开发并不一定需要巨额的资金投入和大量的计算资源。这一观点的提出,无疑为AI行业的未来发展提供了新的思路和方向。
Stargate项目的质疑
就在“星际之门”计划(Stargate)公布的同一周,扎克伯格还特意在Facebook上提醒大家,Meta正在路易斯安那州建造价值100亿美元的数据中心。亚马逊也计划在乔治亚州投资110亿美元扩建其亚马逊云服务(AWS),微软曾表示,仅今年就计划在人工智能相关领域投资800亿美元——他们认为其中部分资金会流向"星门"项目,但大部分早已规划用于扩展现有的Azure云基础设施。
这就是为什么DeepSeek的冲击力如此之大。可以说,这是迄今为止对当前人工智能格局最重大的一次挑战,尤其是对过去几年驱动生成式AI热潮的那种天价融资模式的挑战。
Nilay和Kylie对Stargate这一雄心勃勃的项目提出了诸多质疑,认为这可能更多是一种公关策略,而非实际可行的计划。首先,5,000亿美元的资金需求本身就是一个令人咋舌的数字。OpenAI目前的财务状况并不支持这样的大规模投资。据报道,OpenAI的收入并不足以支撑这一庞大的资金需求,这让人对资金来源的真实性产生了质疑。有人直言,500亿美元这个数字完全是一个编造的数字。
Stargate项目的可行性也受到质疑,OpenAI宣布这一计划的时机,可能更多是为了在政治和商业上获得支持,而不是基于实际的财务能力。这样看来,Stargate项目可能更多是一种公关策略,而不是一个实际可行的计划,即使OpenAI能够筹集到部分资金,要在四年内完成5000亿美元的投资几乎是不可能的任务。
DeepSeek对AI开发成本的影响
DeepSeek的开发成本远低于行业巨头如OpenAI、Meta和Google的模型,但其性能却相当甚至更优。据报道,DeepSeek的开发成本不到600万美元,而OpenAI的GPT-4据称花费了1亿美元。这一巨大的成本差异引发了对AI开发成本结构的重新评估。DeepSeek的成功表明,AI开发不一定需要巨大的计算资源投入,这可能改变行业的成本结构,为AI开发带来新的可能性。
DeepSeek的成功不仅展示了其在技术上的突破,更预示着AI开发成本结构的重大变化。这种变化将影响整个行业的发展,促使更多企业和研究机构重新评估AI开发的策略和资源分配。未来,AI开发可能会更加注重效率和成本控制,而不仅仅是依赖于大规模的计算资源投入。
在讨论中,Patel和Robison还提到了DeepSeek对AI行业的其他影响。例如,DeepSeek的出现引发了对AI开发闭源模式的质疑。尽管OpenAI等公司一直采用闭源的方式,但DeepSeek的成功表明,开源也可能在AI开发中取得显著成果。这可能会促使更多公司考虑开源策略,以提高开发效率和降低成本。
DeepSeek的成功还引发了对AI开发资金投入的重新评估。长期以来,AI行业一直依赖于大规模的资金投入来推动技术进步。然而,DeepSeek的低成本开发模式表明,AI开发不一定需要巨额资金的支持。这可能会促使投资人和企业重新考虑对AI项目的资金投入策略,更加注重项目的实际效益和成本控制。
科技巨头的反应
DeepSeek借力于开源社区的成果,以惊人的速度实现了技术迭代。讽刺的是,OpenAI如今指责DeepSeek侵犯知识产权,称其利用了一种名为“蒸馏技术”的方法,以自家模型为基础训练新模型。然而,这种指控显得有些自相矛盾——毕竟,OpenAI最初也曾未经许可抓取互联网数据来训练其模型。
DeepSeek的成功揭示了一个重要事实:闭源大模型的先发优势并不像想象中那样牢不可破。那些被寄予厚望的高估值模型,或许并没有坚实的“护城河”。如果一家从中国对冲基金剥离出来的初创公司能在短时间内赶超,是否意味着前沿模型的壁垒正在崩塌?与此同时,在其他科技股下跌的背景下,Meta逆势上涨,这或许反映了市场对开源模式的信心。
曾经,OpenAI的高层在面对竞争时表现得颇为自信,认为模仿者无法触及最前沿的技术高度。但DeepSeek的表现正在打破这种认知。它不仅在几个关键领域实现了创新,还显著优化了模型性能,成为开源模式潜力的有力证明。或许,真正值得担忧的,正是那些守着闭源模式的巨头们。
Neil Lawrence的分析
Neil Lawrence是剑桥大学首位DeepMind机器学习讲席教授,他从学术角度分析了DeepSeek的影响。
Google、Meta、OpenAI因为自己的霸权被挑战而恐慌,但硅谷的应用层初创小公司们,这场技术震荡,更像是一场狂欢。AI的普及正逐步兑现它“像电力一样无处不在”的承诺,不仅触手可及,还成本低廉,为无数尚未被设想的创新提供了可能性。一位硅谷的投资人说,现在,只需一个Stripe账户、一个DeepSeek账户,再加上三个人,就能启动一家潜力无限的公司。
DeepSeek的创新更像是对现有技术的精妙整合——如果说美国团队打造的是粗暴改装的美式肌肉车(比如直接塞进V8引擎不顾能效),那他们的作品就像打开梅赛德斯AMG引擎盖时看到的艺术品级工程设计,那种硬件层面的精妙布局令人叹为观止。
在研读DeepSeek团队的论文时,最让Neil教授震撼的是两点:
- 首先是GPU负载分配,这种硬件层面的深度优化能力,在英国乃至多数机器学习PhD群体中都极为罕见;
- 其次是他们的组织管理——众所周知,当AI团队规模超过35人就会遇到沟通损耗的困境,而DeepSeek似乎以百人规模的团队实现了高效协作,这对组织管理模式的考验非常重要。
用汽车改装来比喻的话,他们不仅是调整零件位置,更像是把整个引擎拆解重组。DeepSeek的成功来源于算法、软件工程和硬件技术的多元融合,以前,顶尖人才都出自伯克利或杨立昆门下的机器学习PhD,而DeepSeek拥有的是既懂算法、又精硬件、还能高效实验的新型复合型人才。
从学术界的角度出发,Neil教授认为硅谷现在存在很强的“AGI泡沫”,他认为Sam和Elon都很擅长运营公司、很擅长融资、很擅长公关但并不完全理解技术。他们一味地号召注入更多资本,但尼尔教授认为这有问题。他认为,如果我们放慢脚步,不是一味地堆资金、堆算力的话,其实能找到不那么花钱的提升模型能力的方法。而现在的情况,很像工业革命初期,人们只顾烧煤驱动蒸汽机,却没人停下来思考是否需要改进冷凝系统。
回顾技术发展史,在航空发展史上,从螺旋桨飞机到喷气式飞机是一次革命性的跨越。同样,在机车发展史上,从蒸汽机车到内燃机车也是一个质的飞跃。这些例子都揭示了一个重要规律:技术的演进往往伴随着“范式转换”,即从一种技术路线转向另一种完全不同、更高效的路径。
目前的大语言模型主要依赖以下几个特点:需要巨大的数据集来支撑模型的学习、训练和运行模型需要消耗大量算力、通过增加参数数量来提升性能,这种方法虽然有效,但就像“螺旋桨时代”的飞机一样,尽管它能飞,却效率不高。这种发展模式需要消耗大量资源,同时也存在明显的性能上限。
DeepSeek的出现让它们反思,当前的AI架构可能并不是最优解。他们认为,未来可能会出现一种全新的技术路线,就像内燃机比蒸汽机更高效一样。这种新方案可能具备以下特点:
- 更高的能源效率:在性能提升的同时大幅减少能耗。
- 更小的模型规模:无需依赖庞大的参数数量。
- 更强的学习能力:能够以更少的数据实现更高效的学习。
从整体来看,当前AI的发展可能已经走入了一个“局部最优”的阶段,但未必是通向未来的最佳方向。DeepSeek让大家开始反思,我们是不是需要彻底重新思考AI的基础架构,是不是未来的突破可能并不是对现有方法的改良,而是一条全新的技术路线。
英国在AI政策的失误
Neil教授认为,英国在AI政策上严重失误,他们过度强调AI的安全性,并对开源生态进行了过度的打压,这反倒正科技巨头的下怀,而耽误了本国的发展。反观同在欧洲的法国,现任总统马纽埃尔·马克龙(Emmanuel Macron)的政策对科技创新友好太多。法国政府大力推动人工智能(AI)领域的发展,他与杨立昆等AI专家密切合作,积极投资人工智能技术和开源生态,推动法国在这一领域取得竞争力,才促成了像Mistral这样的法国AI企业的崛起,使法国在全球AI竞争中占据了一席之地。