问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

超越“套壳”:AI应用的未来之路

创作时间:
作者:
@小白创作中心

超越“套壳”:AI应用的未来之路

引用
1
来源
1.
https://pt.plus/02-10-2025-beyond-wrapper/

春节前后,Deepseek的爆火让人们看到了一个新的可能:当模型成本大幅降低,AI应用是否终于等来了自己的春天?确实,在过去一年里,“GPT套壳”成了AI创业最大的困境。高昂的token成本让许多产品难以规模化,更遑论建立护城河。现在,随着开源模型的崛起和算力成本的下降,这个瓶颈似乎被打开了。但成本的降低并没有完全解除“套壳”的诅咒。一个产品如果只是简单地包装了LLM的能力,无论成本多低,始终难以形成真正的竞争优势。

关于AI应用的四个问题

A16Z的合伙人Andrew Chen在最近的一篇短文中提出了4个问题:

  • 如果AI模型初创公司的防御性很低,并且开源替代品和新进入者不断出现,随着时间的推移,优势逐渐减弱,情况会怎样?谁最终会获胜?
  • 新的AI优先应用受益于新颖性,实现惊人的增长。随着时间推移,当这种新颖性消失,用户预期每个产品都有AI特性,谁会赢得用户?
  • 过去,一个新产品可能需要几个月的时间来复制,并需要一段时间来建立领先地位。但很快,它几乎会被立即跟进。那么,产品如何留住用户?
  • 近年来,没有自行训练模型的AI产品被嘲笑为低技术含量的“GPT套壳”。然而,过去几十年的消费者产品技术含量低,护城河看似很窄,却创造了巨大的价值。未来会重蹈吗?

Chen提出这些问题,不仅仅是由于他在A16Z的投资方向,更是由于他对于消费互联网上的工作经历,这包括他在Uber的早期增长上的成绩,以及后续在这个主题上数百篇的文章输出——它们最终结集出版为The Cold Start Problem一书。


Andrew Chen划分的网络效应的阶段

在本周的Links + Notes中,我摘录了Chen对这些问题的部分观点,其中是一个核心比喻是:现在的“GPT套壳”其实很像第一波的Web应用,由于这些应用基本上都可以看作是在数据库基础上面加了一层UI,也有一种说法,认为这些Web应用都是“CRUD套壳”。无独有偶,当下的美股市场也有类似的比喻:人们开始担心AI泡沫可能如互联网泡沫一般轰然倒塌——最典型的那些企业,如Webvan和Pets.com,正是所谓的“CRUD套壳”。如果说200多倍市盈率的Cisco至少还卖出去一些铲子,这些“套壳”的dotcom始终没有找到合适的盈利模式。

那么,是什么拯救了“套壳”?

全面与深入

在Web 1.0时期,今天硕果仅存的莫过于Google和Amazon。尽管它们当时的形态和今天大不相同,但我们仍可从中总结两个成功要素。

首先来看Google。严格来说,Google不能算是一个“CRUD套壳”产品。它具备自己的技术护城河,用PageRank算法解决了纷繁复杂的互联网上如何进行索引和排序的问题,同时期的竞争对手如Lycos和WebCrawler则主要以来搜索关键字在网页上出现的位置和频次,体验上就出现了代差。

Google做对了很多事,但回头来看,最重要的是它依靠自己的技术优势占据了“全面”这个位置。特别是在dotcom泡沫中,网页的数量快速增加,而发现这些网页的入口还停留在Yahoo和AOL这样的目录式结构上。全面、快速、准确,是搜索体验成功的关键,而这其中,全面是一个基础,如果不能做到覆盖全网,那么用户就会转投他处。

如何呈现“全面”其实并不容易,但反面却很容易暴露出来。每一次搜索,Google都在精心展示自己庞大的索引,在用户心智中建立起“全面”的认知壁垒。这个壁垒延续到后续的很多产品中,包括Gmail、News和收购而来的YouTube。

YouTube的收购发生在2006年,在此之前3年,Google还收购了Blogger。后者今天已经基本不再被提起,但可以认为这两次收购的动因是类似的,都是希望在生态上更加“深入”,从单纯的“入口”深入到内容中。YouTube在2024年的贡献了超过300亿美元,20倍于当年的收购价格。

讲到“深入”,再来看Amazon。Amazon的模式显然要比Google重很多,最开始从图书起家,逐渐拓展到“全面”。Jeff Bezos把Customer Obsession奉为信条,最重要的投资就是在自建物流上。这件事是一项耗资巨大的资本支出,而且在dotcom浪潮中“重资产”显得并不性感,但Amazon有自己的坚持。这个故事大家都很熟悉,不再赘述。

“全面”和“深入”是在简单的CRUD数据库操作之外的两个方向的价值延展。AI应用可以做什么呢?

“全面”这个价值点在AI搜索上已经有所体现,能做文章的地方有可能是结合long context(长上下文窗口)和多模态来检索那些之前未能被充分索引的地方。如前所述,展现“全面”这个能力其实不容易,比如说搜索结果能帮助用户索引到一本书,用户很可能自己也没有听过或读过这本书,所以也不清楚这本书是不是真的有价值,相对于另一个没有索引到这本书的结果,体验上的差异性可能没有那么大(想起Kimi为了推广自己的长上下文,特别在视频中搬来红楼梦,实际上也是一个侧面印证)。这里需要长时间的细节打磨和用户认知建立,一旦建立起这个认知,价值就相当大。

Kimi与红楼梦

“深入”方面,能做的事情很多。最近OpenAI发布的Deep Research被认为是第一个“好用的agent”。Wharton商学院的Ethan Mollick甚至认为:“它将困难和矛盾的概念交织在一起,找到了一些我意想不到的新联系”,达到了“接近博士级别的分析”。但这很可能只是AI应用走向“深入”的第一步,Deep Research所用到的数据来源并没有超出传统搜索的范畴,而更多是依靠推理模型进行数据的深度筛选和加工——这可能意味着,推理模型可能是AI应用走向“深入”的关键路径。

Ethan Mollick使用Deep Research的截图

网络与规模

Andrew Chen的The Cold Start Problem一书提出了Atomic Network的概念,他观察到:网络早期会存在一些最小化的单元,可以独立存在和成长,比如Facebook最初是在大学校园中创办的,一个学校甚至一个班级上的同学就可以独立存在。识别、孵化并复制这样的“原子网络”就是借助网络效应完成冷启动的方法论。

这个方法论结合了大量在Web 2.0时期的实战经验,不仅在社交网络上,在Square、Shopify、Uber和Airbnb上等应用上也获得了实际成功。道理不难总结,构建网络效应不能等待自我实现,而是要通过各种手段促成“冷启动”,之后再用各种手段进行管理,加速成长,并赋予秩序(参见:新颖与秩序)。

在CRUD之上,这些平台映射和沉淀了现实世界中的关系图谱,社交、内容、交易、出行等等。这些数据创造、记录并延伸了人类社会中的种种连接,从而富有更大的价值。没有人会认为,这些应用只是简单的“套壳”了。

这种思路中隐藏着一个在互联网时代默认成立的假设,就是边际成本为零。在不考虑服务额外一个用户的成本的情况下,网络构建的问题被简化为新增、留存和商业化的问题——这也是Chen提出的四个问题的基本框架,也可以认为是互联网商业模式的通用模式。

在模型token成本较高的时候,这个模式难以套用到AI应用上来。美国市场上主流的商业模式,无论toB还是toC,都是付费订阅;国内的免费+买量模式则在最近的讨论中被Minimax的创始人所挑战。

从用户角度看,如果用AI生成了内容需要付钱,那么在没有明确的回报的情况下,先前投入的成本无疑就是门槛,为什么又要如互联网时代一样免费分享,用爱发电呢?这也说不通。这可能也解释了为什么最先出现的AI应用以toB和toP(Professionals,包含较为专业的内容创作者)为主。

在模型竞争开始分化,成本一路走低的情况下,假设可能会发生变化:Deepseek依靠免费+口碑传播,在短短几天内获得了上亿的用户量。这里不能排除大量的用户可能只是为了新颖性而来,但也不排除一些用户会养成习惯,甚至形成认知——这是包括豆包、Kimi等一众国产AI应用在大量流量推广费用之后仍未能达到的结果。

结合春节前后在社交媒体上的观察,可以看到Deepseek的传播呈现出圈层的形态:有人问运势,有人写小说,在每一条内容分享下面,评论区里都有热闹的讨论。在我看来,这种圈层传播已经出现了Atomic Network的雏形:它借助现有的社交媒体的基础设施进行分发,用户的评论互动行为实际上已经暗藏了网络效应的萌芽。

Deepseek过硬的模型能力和独特的生成风格似乎跨越了“图灵测试”的门槛(OpenAI的Deep Research也达到了):只要内容足够好,大众并不在乎是AI还是真人。

如果一个AI应用能够激发用户的广泛互动,进而产生新的连接,那么“套壳”之说自然也就不攻自破。

For You

美国消费互联网都未能及时预判的是个性化在平台构建中的力量。

来看Meta。

负责Facebook和Messenger的Tom Alisons在2022年4月的内部备忘录可以作为证明:在这份后来可以轻易搜索到的文档中,Alisons为Facebook定下的基调是成为Discovery Engine,换句话说,就是重新重视个性化推荐的作用。

负责Instagram和Threads的Adam Mosseri则在过去几年中坚定的推进Instagram的个性化,在这个十几年以来一直以关注流为主的老产品上动刀子不容易,那么在新产品Threads则默认为For You。“Adam Mosseri apology”这个搜索关键字下可以找到他过去的各种向用户道歉的记录。


Adam Mosseri在Instagram上通过视频解释产品算法的更新

Elon Musk的X也是一样,收购之后,很快就把For You改成了默认首页,根本不顾老用户的批评。这些都被认为是美国互联网向TikTok看齐的例证。Ben Thompson和Eugene Wei有一次对谈,专门对比了几个产品的变化,感兴趣的可以再去读一读。

For You具有很强的两面性:一方面,它补足了Follow的若干缺陷,支撑网络规模近一步延展,在Chen的理论中,它提高了网络效应的天花板;另一方面,它又是反网络效应的,很多产品实践表明,在For You推出之后,显性关注关系(Follow)都会出现衰退。

原因在于:For You比Follow更私密。一个简单的事实是:在大部分平台上,你关注了谁是默认公开给平台上的其他人的,但你的For You页面(即推荐流)的内容却不会被其他人看到。在日常生活中,无意中窥见其他人的推荐信息流都可能会带来社交尴尬甚至“社死”:算法对一个人从内至外的曝光是彻底的,其程度有时候并不亚于聊天记录。

AI应用则是再次升级的For You。与ChatGPT的聊天记录中一定会曝出惊天地泣鬼神的超级猛料,只是时间问题。华尔街日报最近报道了一个与未来的自己对话的AI应用Future You(在本周的Links + Notes中可以找到关于这个产品的解读)。Future You像是Character.ai平台上的一个优质bot,它背后的团队具有来自MIT、UCLA和Harvard的深厚心理学和AI背景,并不能指望这样的bot能通过简单复制而规模化。同时,其中的很多对话只能发生在用户与AI之间。打破这一层社交屏障需要巧妙的产品设计:人们既要保护隐私的控制权,又不喜欢繁复的设定界面。

ChatGPT Memory

好在AI可以学习,更细致入微的理解用户偏好。ChatGPT中的Memory功能有时候会带给我这种惊喜。在这一点上,个性化的数据飞轮——用户使用越多,就越能For You——仍然成立。否认这一点,相当于否认了人性大体相通。

AI应用如果想要更好的融入消费者的生活,最需要学习的其实是人类社会中各种约定俗成的文化和习俗。如果AI能够预判到尴尬的局面,就能在行为上更有分寸感,也就能更好的打破公共、社群与私人语境的屏障。也就消解了“套壳”的诅咒。

走向盈余

Andrew Chen最后没有结论。我也没有。此刻,成本下降对AI应用的利好似乎为2025年设定了一个美好开端,但市场上的优秀产品仍然乏善可陈。

如果LLM = 数据库,prompt engineering = CRUD,那么我们很可能处于2000年互联网泡沫前的一段时间,估值虽高,但还没有达到彻底崩盘的局面;应用随多,但还没有找到自己如何在“套壳”之上做宽做深,也未能解决网络效应与个性化之间的左右互搏。

一切需要时间。一些紧缚的假设已经放松。算力正在走向盈余,正如认知曾经走向盈余一样,创造、分享、连接、感受,而不仅仅在日新月异的模型竞赛中重复“套壳”。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号