《贝叶斯的博弈》:真正的高手都是贝叶斯主义者
《贝叶斯的博弈》:真正的高手都是贝叶斯主义者
贝叶斯主义是一种基于概率论的认识世界的方法,它通过不断更新先验概率来获得后验概率,从而实现对世界的认知和决策。本文将从归纳和演绎两种基本认知方法的局限性入手,引出贝叶斯主义作为一种新的认识论方法,并通过多个具体例子(如火鸡寓言、飞机失事搜救案例等)阐述了贝叶斯公式的原理和应用。
认识世界需要方法。归纳和演绎则是两种最基础的方法,但这两种方法都有缺陷。
归纳法是从特殊到一般,通过观察或实验、收集和分析数据、验证假设,对命题假设进行证实或证伪判断的过程。归纳法的问题在于无论观察多少只天鹅是白的,只要出现一只黑天鹅,那结论就被推翻掉。所以归纳法得出的结论只有两种状态,即已经被证伪和尚未被证伪的,不存在绝对正确的结论。
演绎法是从一般到特殊,以一个或多个命题为起点,通过运用不包含任何实证研究的纯粹逻辑推理,得出与该命题等价的其他命题的过程。演绎法的问题在于必须保证起点命题和推理过程是没有问题的,而现实中做到这两点都很难,尤其是第一点。
因为知识产生的底层方法有内在缺陷,所以大卫休谟讲:所有知识都可转化为概率。这里的概率形成机制,就引出了一种认识世界的新方法:贝叶斯主义。
举几个例子先来具象地体会下贝叶斯:
一个人有两个孩子,其中至少有一个孩子是男孩的概率是多少?答案是3/4
一个人有两个孩子,而且其中至少有一个是男孩,那么另一个也是男孩的概率是多少?答案是1/3
一个人有两个孩子,而且其中有一个是周二出生的男孩,那么另一个是男孩的概率是多少?答案是13/27
答案违背直觉,因为人往往无法正确评估新要素产生的影响,尤其是当新要素带来非线性变化。而这正是贝叶斯主义擅长的地方:基于新的先验信息,来持续调整后验概率。
贝叶斯公式很简单:
其中,P是概率;P(A)是A发生的概率;P(A|B)是在B发生的情况下,A发生的概率;类似,P(B|A)是A发生的情况下,B发生的概率。
就是这么个简单的公式,极大地影响了认知学,也是人工智能的基础。用认知学来描述贝叶斯公式是:用事实刷新认知;从人工智能角度则是:用数据喂养出智能。但人脑偏爱低功耗,有限理性的,存在许多阻碍贝叶斯原理工作的思维bug,比如选择性偏差、过度乐观/悲观、不确定性厌恶等(关于认知偏差,可阅读《偏差》:成为更好的决策者)。至于贝叶斯算法和我们大脑中的bug,最终是道高一尺还是魔高一丈,关键在于我们能否打造知行合一的反馈飞轮。
在经典的火鸡寓言中,一只火鸡自出生就得到农场主精心的照顾,有舒适的环境和每天的食物,于是火鸡认为农场主是爱自己的,生命的一切都很美好,直到感恩节的前夜,农场主把火鸡变成了餐桌上的美食。由于火鸡得不到高质量的先验信息,所以火鸡难逃厄运。这也是为什么我们不应把时间花在刷短视频上,因为算法在精准投喂我们喜欢的内容,而不是对我们有价值的内容。没有高质量的新信息/观点,则无法构建高效的、自我纠偏的、符合贝叶斯主义的反馈飞轮。
这个视频中,马斯克认为的人生最大挑战实际上就是成为一个贝叶斯主义者。
来看一个贝叶斯主义者的实际决策案例。一架飞机失事,为提高搜救效率,把失事海域分为ABCD四个等面积区域,根据掌握的飞行信息,飞机在A海域失事的概率为70%,B为12%,C为10%,D为8%,另外在每个区域进行搜索的命中率为70%。作为决策者,首先肯定先搜索A区域,但如果A区域未搜救到失事飞机,怎么办?按照贝叶斯公式:
假设事件A为飞机失事于A海域,概率为P(A);事件B为在A海域未搜索到失事飞机;那么P(B|A)为30%,P(B)为70%*30% + 30%=60%;通过贝叶斯公式可以算出P(A|B)为41.2%,这是第一次搜索结果后调整的新概率(认知)。类似的方法可以计算出B、C、D海域的新概率为23.5%、19.6%、15.7%。所以第二次搜救的正确决策是应该依然搜索A区域。
一旦我们脑中建立起贝叶斯模型,就可以很从容地应对事情和人,尤其是在面对不确定的复杂系统和仅有有限信息时。让乔布斯擦桌子,并不会比一个清洁工好/差很多;但让乔布斯管理一家公司,会比一个平庸的CEO好1000倍,因为随着事情复杂度的上升,高手和低手之间的效率差会越来越大。贝叶斯主义者都会拥抱不确定性,不仅以此来完善自己的认知,并且会在复杂区域拥有认知优势,形成一个双重正反馈回路。
贝叶斯主义者奉行的是以全局的思维理解/建立系统的目标,确保自己始终走在模糊但正确的道路上。可以把贝叶斯公式简单做个如下图的变形,不要以固有认知形成约束,而是要敢于主动失控,让一切发生,然后顺势而为。