从第四范式到第4.5范式
从第四范式到第4.5范式
2007年1月28日,数据库领域的大师Jim Gray独自乘船离开旧金山,去一个叫Farallon小岛洒他母亲的骨灰,不幸在外海失踪,至今没有影踪。在失踪的三周前,2007年1月11日Jim Gray做了他一生的最后一次学术演讲,在演讲中提出了著名的“第四范式(the Fourth Paradigm)”。
Jim Gray认为人类获取知识的方式经历了四次范式:
- 第一范式,以经验为核心:人们主要通过观察自然现象获取知识;
- 第二范式,以理论为核心:人们开始从经验中抽象出理论,比如开普勒定律、牛顿力学、麦克斯韦方程等,使用理论对世界进行建模,大大加深了人们对世界的理解;
- 第三范式,以计算为核心:理论到达一定复杂程度后,不依赖于计算,人们已经无法直接分析理论了,人们必须依赖计算这个分析工具,才能继续深化对世界的认识;
- 第四范式,以数据为核心:随着理论和计算的成熟,人们制造出了先进的观察仪器、构建起来了先进的计算系统,观察工具和计算系统则源源不断地产生着数据,由此人们进入了第四范式,人们必须面对数据,通过分析数据来获取知识,比如天文学家,现在天文学家每天的工作不再是观看星空,而是处理和分析来自仪器的大量数据。
“第四范式”是Jim Gray于2007年以科学研究为背景提出来的,而“大数据”这个概念流行起来,是来源于麦肯锡研究院4年后的报告《Big data: The next frontier for innovation, competition, and productivity》。数据科学大师Jim Gray在2007年就预见到了“大数据”对于世界会产生方方面面的影响,而且非常深刻地判断到了这种影响将达到范式转换的程度。
正是2007年这一年,Geoffrey Hinton确立了以受限玻尔兹曼机和有监督的反向传播算法为核心的第一代深度学习理论。五年之后,2012年,深度学习的“Sputnik时刻”——“AlexNet时刻”来临,Hinton与他的两位博士生Alex Krizhevsky、Ilya Sutskever设计了在深度学习历史上具有里程碑意义的AlexNet,在当年的ImageNet大赛上以极大的性能优势夺冠,AlexNet让深度学习站到了AI舞台的中央。
深度学习基本符合Jim Gray所提出的“第四范式”,但Jim Gray应该也没有预料到深度学习所具有的一个特性会将“第四范式”推到了一个之前完全不可想象的高度,这个特性就是——Scaling Law。
按照Sam Altman的说法,OpenAI已经取得的成果和未来将会取得的成果背后的基础,用3个词来说就是“deep learningworked”,用15个词来说就是“deep learning worked, got predictably better with scale, and we dedicated increasing resources to it”。Sam Altman所说的15个词就是Scaling Law。
Deep learning和Scaling Law正在把“第四范式”推向“第4.5范式”。“第4.5范式”与“第四范式”的关系是互补性的,“第四范式”与“第4.5范式”是解决“data exploration”问题的两种方法,两种所利用的数据资源不同,前者的特点是以针对性达到低成本,后者的特点是以高成本换取通用性、以通用性再来化解高成本。如果说Palantir是“第四范式”的标杆,那么OpenAI与Anthropic就是“第4.5范式”的代表。
未来“几千天后”,“第四范式”加上“第4.5范式”能否形成革命性的“第五范式”——超级智能,是OpenAI们与Palantir们都正在思考的问题。