问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

技术的力量,开源的力量,初创生态的力量。

创作时间:
作者:
@小白创作中心

技术的力量,开源的力量,初创生态的力量。

引用
1
来源
1.
https://xueqiu.com/1786904335/323342821

2025年1月,DeepSeek发布开源推理模型R1,在全球掀起了广泛讨论。《晚点LatePost》邀请了FusionFund创始人张璐,来聊聊当前美国科技圈和硅谷语境中,对DeepSeek等模型的讨论。

DeepSeek“冲击”,开源生态的胜利

近期,DeepSeek在中国备受瞩目。它既不是之前像字节、腾讯这一类大的科技巨头,也不是2023年之后形成的中国大模型的“六小虎”。DeepSeek是一家充满神秘色彩的公司,它在国内特别火的一个重要原因是“墙内开花墙外香”——人们发现它在国外,特别是美国的技术社区,受到了极高的关注。

FusionFund创始人张璐表示,她上周在参加达沃斯峰会期间,各路商业领袖都在讨论DeepSeek。在硅谷这边,去年年中,她曾与一些OpenAI和Anthropic的朋友交流,他们当时已经提及正在关注DeepSeek所从事的领域。DeepSeek这次也是代表中国的模型公司,在国际科技领域获得了广泛认知和关注。

张璐认为,DeepSeek能有如此出圈的影响力,重要原因之一是开源生态的胜利,而开源的繁荣更有利于初创企业。开源生态中信息沟通与交互是比较高效的,特别是对于新型模型基础架构(Architecture)层面上的探索,大家都会比较关注,尤其过去这一周,DeepSeek新发布的R1给大家一个很大的惊喜。

具体来说,DeepSeek的最大亮点在于开源生态的胜利。这个公司做得非常优秀,但最大亮点在于开源生态的胜利。我们一直非常支持开源生态,这个生态其实有很大的潜能,所以在过去的这几个星期,可能大家比较兴奋的一点是,觉得DeepSeek证明了开源正赶超闭源,甚至有望超越闭源的一个发展速度。开源的发展速度让大家看到构建广泛生态合作的可能性,这种合作超越了地域限制。即便像DeepSeek这样远在中国的团队,也能在开源生态中作出巨大贡献。所以我觉得,开源社区内彼此支持尤为重要。当然,DeepSeek有很多创新的地方,但这些创新无疑也建立在众多前沿开源生态、闭源生态所提供的丰富模型和架构基础上。

另一点,张璐认为强化学习(Reinforcement Learning)虽然并非新鲜事物,但如今已实现完全无监督的强化学习,这一点尤为关键。这对整个Scaling Law而言同样是个好消息,因为它能够省去大量的数据标注过程,特别是R1部分,结合更多合成数据,让模型自我“反思”。成本问题同样备受瞩目。成本的显著降低,确实给大家带来了很大的惊喜。这一成本的削减对人工智能未来的产业应用及垂直领域的发展都将起到极大的推动作用,DeepSeek可以把成本降到这么多,打开了未来大规模商业化的可能性。

张璐表示,她一直比较相信在大模型这个技术上,开源是很有可能会追上闭源的。在去年3月的公开演讲中她曾提到,我们非常有信心,也很相信开源生态的发展可能性。此外,当时我们秉持着一个整体理念,这也反映了我们的投资偏好——我们不投ToC,而是专注于投资那些面向企业级应用(ToB)的人工智能公司。因此,这些公司的发展方向势必不是单一的大模型,而是更多聚焦于垂直领域的小模型。

怎样在垂直领域小模型的基础之上,提升其效能和准确率呢?那开源生态的好处是它的多样性比较大,这里可以看到各式各样的架构以及Inference层面的创新,来帮助优化,让它这个垂直领域小模型可以做得更好。

此外要探讨的是,开源生态对谁最为有利?显然,它对初创企业最有利,而闭源则更有利于大企业。作为早期的科技投资人和投资机构,当然也从私心的角度希望开源生态可以发展得更好,我们也看到这些蓬勃发展的初创企业生态对开源生态的支持和需要。

DeepSeek会不会改变大家对中国模型的讨论呢?张璐认为这或许会引发一些讨论,但DeepSeek似乎与中国其他模型公司所走的路径不太一样。DeepSeek改变大家对中国模型的印象:工程优化外,底层架构也有创新。当然,她可能对中国其他模型公司的了解并不那么深入,但在我看来,DeepSeek可能是第一家让美国这边的模型公司、初创企业乃至整个AI圈看到,中国的这些人工智能公司、模型公司也在进行底层架构创新的探索。

众所周知,中国的公司执行力很强,许多从0到1的创新在美国出现后,中国会迅速落地应用。然而,张璐认为DeepSeek并未过多关注商业化角度的探索,它更多地聚焦于底层架构创新方向的探索。当然,它在工程领域也有诸多出色的创新,但她认为这一点可能是它与其他中国模型公司相区别的一个重要原因。

另外的话,AMD宣布与DeepSeek合作,但这也不是利空英伟达,因为DeepSeek等成果会降低更多行业使用大模型的成本门槛。

张璐表示,她不知道这个段子的真假,因为她也没有去关注你说的这个平台。DeepSeek V3 557 万美元训练费用,只算了 GPU hours(GPU 使用成本),这一价格并未涵盖前期的投入与研发成本。这就像烹饪一道菜肴,我们是只计算炒菜时所用的原材料和调味品的成本,还是将厨房的建设、锅碗瓢盆的购置等前期投入也一并计入成本,这两种计算方式是截然不同的,我认为这是需要考虑的第一点。

第二点,张璐认为成本考量是当前人工智能模型发展方向上的核心话题之一。对于Meta而言,他们无疑面临着压力。在开源生态中,Llama 架构一直备受瞩目,其结构和架构被广泛采用。简而言之,如果要利用开源生态的模型来构建应用,很多人可能会优先选择复制 Llama 的结构。Meta 期望 Llama4 不仅能成为最好的开源模型之一,还希望能超越闭源模型。所以DeepSeek实际上为Llama探索了一个新的模型结构方向,这对Llama的整体内部产品发展是有利的。

然而,对于一个大型科技公司而言,尽管前期投入巨大、且体量庞大,从品牌公关的角度来看可能会面临一些挑战——为什么一个小公司能做得比大公司更好?

所以张璐认为,这既带来了实际层面上的好处,也涉及到非技术发展层面的考量。从这个角度来看,对Meta长远来说是个好消息,只是现在大家可能会直接拿它与其他公司进行比较,因为毕竟在开源生态中,它是唯一一家大型科技公司,而且一直希望成为开源生态的领头羊。它这样做的目的是与谷歌等做闭源模型的大科技公司区别开来,打出自己的优势,并且鼓励更多开发者在开源生态中利用Llama的结构。

推理模型带来的Agent机会

张璐试用过OpenAI Operator,它的核心功能在于能够协助用户完成任务,而不是仅限于简单的一问一答模式。例如,当你要求它预订机票时,它会主动搜索并核实相关信息。然而,从速度层面来看它还是比较慢的,当它调用搜索引擎时,你会发现搜索速度远不如你自己手动查询,仿佛一位行动缓慢的老太太。另外还存在一个问题,就是它有时会编造信息或数据,这可能是早期就存在的问题,但张璐觉得前景还是非常美好的。

不仅是OpenAI,Salesforce、微软等大公司在布局行业Agent。所以张璐认为这是一个大的产业发展方向,AI agent在各行各业的垂直应用,与她前面提到的行业应用中的垂直领域小模型,实际上是相辅相成的,这为我们带来了很多好的机会。

张璐表示,这话得“打折”听。Sam Altman说的时间线可能要稍微给他多延长一点,没有那么快。

从C端用户的角度来看,可能只有那些已经购买了Pro版的用户才会去尝试使用它。从B端的角度来看,张璐与众多企业客户接触较多,对于美国的企业客户而言,她认为他们是否愿意为目前Operator所提供的功能支付每月200美元的费用的可能性相对比较低。美国B端客户对准确性和专业度要求高,对当前Operator的形态接受度低,更希望获得专业、精准的产品。

Operator与传统RPA(流程自动化)的区别是什么?交互革新。其实,ChatGPT的接受度之所以这么高,主要是因为其使用门槛低。这个门槛低到你只需具备聊天能力,便能轻松上手。Operator也一样,它就相当于你的个人助理,每个人只需用简单的口头语言发布任务,它就能持续执行并推动流程的自动化。但是,传统的流程自动化软件还需要经历一个复杂的整合植入过程(integration),有使用门槛、技术要求和植入周期,张璐认为这是它们之间一个较为根本的区别。

从根本上讲,人工智能并非一个全新的概念或技术,它已经存在很长时间。甚至我们刚才多次提到的强化学习也并不是新事物。那么,为什么现在大家会突然觉得人工智能的接受度如此之高,推广速度如此之快呢?张璐认为,这主要得益于交互层面的创新,让人们意识到,原来可以以如此简单的方式、如此低的门槛来使用人工智能工具。

医疗、金融、保险、太空科技领域都有Agent应用机会。

当这种Agent应用问世后,它的功能已远超简单聊天,而是涉及更多操作与用户敏感信息。张璐也提到了隐私方面的隐忧,这确实是大家接下来会重点关注的问题。

特别有意思的一个实例,比如公司为员工提供了一项福利——通过线上平台预约心理健康咨询服务。如果员工感到焦虑或有其他心理问题,可以通过该平台预约心理医生进行交流,或者选择与AI分享自己的困扰,并获取AI提供的解决方案。有趣的是,大多数人倾向于向AI透露自己的私密信息,而不是预约心理医生,这个现象在年轻人中更多,他们似乎更倾向于与人工智能分享个人隐私信息。

当然,这里确实存在隐私信息的担忧。但从人使用的角度来看,他们似乎对人工智能的信任度高于与心理医生交谈的信任度,更愿意向人工智能敞开心扉。张璐听到有人与她分享这一新数据时,她也感到惊讶。她想,这可能与年轻一代的成长环境有关。回想我们这一代的成长环境,智能手机、互联网等似乎是非常自然、理所当然的存在。那么,对于下一代人来说,使用人工智能,甚至使用像AI agent这样的工具,会不会成为他们与世界交互的更自然的方式呢?所以,尽管隐私考量确实存在,但她认为用户行为上也会有很多变化。

除了“AI”

在硅谷的讨论和视野中,除了AI之外,大家现在关注的一些热点是什么?

张璐表示,两个热点,一个是医疗,现在有一个新的词叫科技和生命科学结合(BioTech)。她参加过一个演讲,它的主题是讲长寿,现在对于长寿的定义已经和之前不一样了。几年前大家更多的讨论是如何延长生命,怎么样活得更长。

但现在的核心已转变为如何提升生命的质量,我们不再一味的梦想活到150岁乃至200岁,而是致力于在有限的岁月中,拥有更高的身体素质、健康的体魄和清晰的大脑。这势必就要求很多新的技术,特别是在医疗技术上的创新。这包括早期疾病的精准诊断、疾病的个性化治疗方案,以及诸如靶向治疗、免疫疗法、mRNA等基础应用的研究。

现在再加上人工智能,人工智能又可以加速在医疗层面上的基础创新。张璐经常说人工智能有点像一个催化剂,它不只是催化很多产业的数字化转型,它其实也会催化和加速很多其他技术的一个创新,包括医疗领域技术的创新。现在我们数字化生物学、数字化治疗、数字化诊断等,这些都是一个非常大好的方向。

另一个张璐很看好,包括现在也在茁壮成长的方向就是太空科技(SpaceTech)。从去年开始,SpaceX的数次星舰发射预示着,在未来的三到五年内,火箭及卫星发射的成本将大幅度下降。如果有一天将一个人送入宇宙的成本仅需5万至10万美金,而将一颗卫星发射至太空的费用也低至1万至2万美金,那么她相信,无论是发射的数量还是频次都将迎来显著提升。而且几个数据不是未来十年的发展可能性,是未来三到五年的可能性,所以它发展速度是很快的。

如果你现在去洛杉矶,就会发现如今的SpaceX,不仅进行了很多太空领域的技术探索,还催生了一个小生态,大约有几百家太空科技公司围绕着SpaceX展开,它们或多或少都与SpaceX有着战略层面的合作,有的甚至直接作为SpaceX的供应商,大部分的创业者都是SpaceX的前员工,因此它形成了一个非常好的创新生态。

像BioTech和SpaceTech他们的中心还是在硅谷吗?张璐表示,美国创新核心在硅谷,波士顿、纽约、奥斯汀,洛杉矶也在崛起——洛杉矶形成了SpaceTech聚集地。

张璐表示,2025年充满变数,期待更好保护创新生态,防止技术和资源被大企业垄断。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号