问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

从大厂到初创,AI领域的‘反规模效应’如何颠覆常规思维?

创作时间:
作者:
@小白创作中心

从大厂到初创,AI领域的‘反规模效应’如何颠覆常规思维?

引用
1
来源
1.
https://cloud.tencent.com/developer/article/2494516

在AI领域,为什么一些只有百人规模的初创公司能够开发出媲美大厂的产品?这背后反映了一种值得关注的"反规模效应"现象。

为什么互联网以及大模型大厂搞不出deepseek这样的产品,反倒是100多人的深度求索搞出来了?
因为对于大厂来说,做一个事情是需要为股东负责。也就是做一个项目的时候,先要评估这个项目赚不赚钱,能不能给公司带来收益。
在OpenAI验证了大模型有效之后。各大厂都是在开始堆人力去搞大模型,但是往往高层是对公司内的大模型团队是有收益要求的。它需要的是一个能够广泛覆盖各个业务场景,同时这个大模型能够对不同业务产生收益的。这就导致资源分散,难以在特定领域做到极致。
而一些小团队往往能够进行“优势”聚焦。它们只会专注于某些垂直领域(如数学推理、代码生成、特定行业的解决方案)。而且它们不需要背负太多的KPI,能够专注的在技术和场景适配上进行突破。像这次DeepSeek这样的产品,在数学领域、代码领域都做到了媲美OpenAI的效果。

同时大厂内部其实往往存在架构冗余的问题。导致很多的时候其实审核流程过慢。比如大模型需要一堆显卡来训练,在购买的时候往往要申请,而这个过程需要审核的内容很多,最后导致买的显卡很久才审批下来。并且训练的模型,往往挑选的技术路线需要符合现有业务或短期商业目标。
而小团队可以快速试错,灵活调整技术方向。例如,DeepSeek这次就搞了一个激进的方案。训练的模型原始就是FP8,最后导致整体以极低的训练成本(600 万美元)和 API 使用成本超越了 GPT-4o 和 Claude Sonnet 3.5。
纵观全球AI产业格局,一个耐人寻味的现象正在显现:OpenAI、DeepSeek、KimiChat等初创团队持续输出标杆级产品,而手握重金的科技巨头却频频错失技术浪潮。这种反差在中文领域尤为显著——当百度倾注数百亿构建文心大模型体系、打造飞桨深度学习框架时,市场最终选择的却是参数规模小一个量级但垂直能力更强的创新产品。
巨头困境的本质在于组织臃肿和路径依赖。以百度为例,其战略布局呈现典型的多线作战特征:既要维持飞桨框架对标PyTorch/TensorFlow的生态位,又在文心大模型体系中并行开发NLP、CV、多模态等十余个模型变体。这种"技术军备竞赛"式的投入,导致资源过度分散在框架适配、算力堆砌和场景覆盖上,反而弱化了核心模型的技术锐度。
值得深思的是,当科技巨头沉迷于"技术全景图"的绘制时,真正的创新往往诞生在细分领域的单点突破中。这印证了管理学中的"反规模效应":在颠覆性技术创新周期中,组织敏捷度带来的加速度远高于资源储备的静态优势。或许正如OpenAI用ChatGPT改写AI发展轨迹所揭示的——在AGI的征途上,专注力才是这个时代最稀缺的技术资源。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号