问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

贝叶斯公式:如何用数据更新直觉?

创作时间:
作者:
@小白创作中心

贝叶斯公式:如何用数据更新直觉?

引用
1
来源
1.
https://www.bilibili.com/opus/1045900299819024421

生活中总有需要做判断的时刻:是该相信自己的直觉,还是跟着数据走?比如,医生拿到一份阳性检测报告,该立刻断定检查者生病了吗?或者天气预报说下雨概率30%,出门要不要带伞?

一个200多年前的数学方法,早就告诉了我们答案:这两个选择并不需要二选一,用数据更新直觉,让理性与经验共同决策。这就是我们今天要学习的贝叶斯公式

1 贝叶斯公式

定理(贝叶斯公式).

是样本空间
上的两个事件,若
,则有:

证明 . 由条件概率的定义
,及乘法公式
,有:

贝叶斯公式是概率论中最著名的公式之一,它揭示了人类认知的两大特征:

  • 基本比率谬误(Base rate fallacy):人们往往被刻板印象左右,忽略了基本比率,从而产生认知偏差

  • 认知迭代:通过新信息不断修正、更新已有认知的思维过程

下面将通过一个典型案例,来阐释贝叶斯公式所揭示的人类认知特征。

2 贝叶斯公式的典型案例

例 .诺贝尔经济学奖得主丹尼尔·卡尼曼(Daniel Kahneman)在其著作《思考,快与慢》(英文名《Thinking, Fast and Slow》,见图 1 )中讲到了这样一个有趣的案例:当你见到图 2 中的女士时,你认为她更可能是大学教授,还是公司职员?

解 .

(1)基本比率谬误

图 2 中的女士身处图书馆,外表知性,从容文雅,符合我们对"大学教授"的刻板印象。因此,多数人会直觉地判断她是一位教授。然而,丹尼尔·卡尼曼指出,教授在总人口中的占比(基本比率)远小于公司职员。从概率上讲,我们更可能遇到一名公司职员,从而这位女士更可能是公司职员。这就是基本比率谬误:人们往往被刻板印象左右,忽略了基本比率,从而产生认知偏差。

丹尼尔·卡尼曼的解释可以转化为精确的数学表达。首先,让我们定义三个关键事件:

图3 的韦恩图展示了事件

的关系。为了说明大学教授的基本比率很小,我们假设
中有8个样本点,
中有160个样本点,那么样本空间
总共有168个样本点。

由于在刻板印象中,大学教授更容易有着“知性、文雅的外表”。因此设定
的大学教授具有这一特征,同时设定仅
的公司职员具有这一特征。这些有着“知性、文雅的外表”的个体在图 4 中以高亮图标表示,它们共同构成事件
。显然事件
中有24个样本点。

完成上述设定后,让我们通过贝叶斯公式来揭示基本比率谬误。首先对贝叶斯公式进行改写:

上式中的每一项都有着明确的意义,让我们从右到左逐项解释:

  • 刻板印象 :这是在大学教授条件下,拥有“知性外表”的概率。由于在刻板印象中,大学教授更容易具有这一特征,因此上面设定
  • 基本比率 :这是大学教授在总人群中的概率与"知性外表"在总人群中的概率之比。该比值从侧面反映了大学教授的基本比率,由于大学教授在总人群中的概率很小,这个比值自然也很小。根据上面的设定,有
  • 理性判断 :这是在“知性外表”条件下,某人是大学教授的概率。贝叶斯公式指出,要避免基本比率谬误,理性地计算出这个概率,需要综合刻板印象和基本比率,即:

同样的,可以计算出在“知性外表”条件下,某人是公司职员的概率:

上述计算结果表明,由于大学教授的基本比率很小,图 2 中的知性女士是大学老师的概率(
)远远小于是公司职员的概率(
)。

(2)认知迭代

可以换个角度来审视丹尼尔·卡尼曼提出的案例。一开始面对“某人是否为大学教授”的问题时,我们能依据的只有大学教授在总人口中的概率
。但看到图 2 后,新的信息
“知性、文雅的外表”出现了,我们的认知立即重构,如图 5 所示。

为了更精确地表达这一认知迭代过程,让我们对贝叶斯公式再次进行改写:

上式中的每一项都有着明确的意义,让我们从右到左逐项解释:

  • 先验概率 :这是大学教授在总人群中的概率。这是未经后续新信息修正的概率,或者说这是先于经验(“经验”在哲学中有着特殊含义,在这里可以简单理解为“新信息”)的概率,所以称其为先验概率(Prior probability)。这里的设定是

  • 证据强度 :这是大学教授中“知性外表”与总体中“知性外表”的概率之比。根据设定,有:

  • 由于在大学教授中具有“知性外表”的概率远高于总体人群(中具有“知性外表”的概率),因此计算结果大于1。这说明该信息可以作为判断某人是否为“大学教授”的有力证据

  • 后验概率 :这是在“知性外表”条件下,某人是大学教授的概率。这是被后续新信息修正过的概率,或者说这是后于经验的概率,所以称其为后验概率(Posterior probability)。贝叶斯公式指出,先验概率经过新信息的修正,得到的就是后验概率(新的认知),即:

  • 同样的,可以计算出新信息 ”知性、文雅的外表“出现后,某人是公司职员的后验概率:

上述计算结果表明,新信息B=“知性、文雅的外表”是对“大学教授”这一身份的有力证据,是对“公司职员”身份的削弱证据。因此,这一信息从不同程度上改变了对应的先验概率。

3 贝叶斯公式的练习题

习题.某疾病在人群中的患病率为2% ,现有一种检测方法,其正确率为 90%,意思是:

  • 对于患病的人,被检测为“阳性”的概率是90%
  • 对于健康的人,被检测为“阴性”的概率是90%

问题1.如果一个人被检测为“阳性”,他实际患病的概率是多少?

问题2.为了提高诊断的可靠性,医学实践中通常会进行复查。如果一个人经过复查仍然被检测为“阳性”,他实际患病的概率是多少?

坚持数形结合,讲好高等数学!

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号