资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

梁文峰的商业帝国：从量化投资到AI大模型的创新之路

创作时间:

作者:

@小白创作中心

梁文峰的商业帝国：从量化投资到AI大模型的创新之路

引用

新浪网

等

来源

https://finance.sina.com.cn/roll/2024-12-31/doc-ineciccv1668598.shtml

https://finance.sina.com.cn/jjxw/2025-01-27/doc-inehkiif9656336.shtml

https://finance.sina.com.cn/tech/discovery/2025-01-25/doc-inehefte1788109.shtml

https://www.jiemian.com/article/9677688.html

https://m.21jingji.com/article/20241122/cbf75036e4c54615f4f59db93dffc281.html

https://www.sohu.com/a/851572173_121924584

https://www.sohu.com/a/845550663_122118475

https://wallstreetcn.com/articles/3719982

https://finance.sina.com.cn/roll/2025-01-18/doc-inefkcqc4452848.shtml

10.

https://new.qq.com/rain/a/20240726A02WTJ00

11.

https://www.7hcn.com/article/466717-1.html

梁文峰，这位80后企业家，一手打造了国内首家突破千亿规模的量化私募——幻方量化，又在AI大模型领域异军突起，创立了被硅谷称为“神秘东方力量”的DeepSeek。从金融到科技，他用技术创新构建起一个横跨两个领域的商业帝国。

从量化投资到千亿帝国

2008年，刚从浙江大学软件工程专业毕业的梁文峰，没有选择进入大厂成为码农，而是带着一群志同道合的伙伴，在成都的一间出租屋里开始了量化投资的创业之路。那时，量化投资在中国还是一个新鲜概念，能否赚钱是个未知数。但梁文峰坚信量化投资之父西蒙斯“一定有办法对价格建模”的理念，坚持在出租屋里独自钻研，历经两年的艰苦摸索。

2010年，沪深300股指期货的推出成为梁文峰事业的转折点。他和团队借此东风斩获颇丰，自营资金迅速突破5亿元。这次成功不仅验证了他的投资理念，也为后续发展积累了资金和经验。

2015年，梁文峰与浙大校友共同创立幻方量化，立志打造中国的顶级量化对冲基金。他们将数学与人工智能深度融合，开启了量化投资的创新之旅。2016年，幻方量化上线首笔AI驱动的实盘交易，随后全面实现交易策略AI化。这一创新举措使旗下基金回报率远超同期沪深300指数，推动公司管理规模快速增长。

2019年，幻方量化管理规模突破百亿元。同年，梁文峰在金牛奖颁奖仪式上发表主题演讲《一名程序员眼里中国量化投资的未来》，提出“量化公司没有基金经理，基金经理就是一堆服务器”的观点，展现了其独特的技术驱动理念。

AI驱动的二次创业

随着业务拓展，AI交易策略对算力的需求急剧增加。梁文峰展现出非凡的前瞻性和魄力，从2019年开始大规模布局AI算力。当年投资2亿元建成“萤火一号”AI算力集群，搭载1100块GPU算卡。英伟达A100芯片发布后，他又迅速成为亚太地区首批获取者。2021年，投资10亿元打造的“萤火二号”上线，搭载1万张A100算卡，算力惊人，相当于76万台个人电脑，占地面积超过10个篮球场。

在当时AI大模型尚未爆发的情况下，如此大规模的算力投入被外界视为疯狂之举，但这恰恰体现了梁文峰对AI未来发展的坚定信念和长远布局。2021年，幻方量化成为国内首家突破千亿规模的量化私募，跻身国内量化私募“四大天王”行列。

进军AI大模型领域

2023年，梁文峰带领团队开启二次创业，成立DeepSeek，正式进军通用人工智能领域。尽管团队规模仅有139人，远不及OpenAI的1200人，但他们凭借创新精神和扎实技术，在大模型研发上取得了惊人突破。

2024年5月，DeepSeek发布V2模型，凭借创新的MLA（多头潜在注意力机制）和DeepSeekMoE（混合专家模型）架构，实现了高性价比的训练和推理，API定价仅为GPT-4 Turbo的百分之一，引发行业价格战，推动了算力普惠。

2024年12月推出的DeepSeek-V3更是震撼全球，在多个基准测试中性能超越顶级开源模型，与GPT-4o等顶级闭源模型不相上下，而研发成本不到后者的二十分之一。这一成果不仅打破了中国AI企业依赖模仿的刻板印象，更以首创精神让中国在全球AI竞争中占据一席之地。

2025年1月，DeepSeek正式发布R1模型。该模型在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。DeepSeek不仅将R1训练技术全部公开，还蒸馏了6个小模型开源给社区，允许用户借此训练其他模型。这种开放共享的精神，与硅谷巨头的闭源策略形成鲜明对比，赢得了全球开发者社区的广泛赞誉。