问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

三门问题的数学原理及模拟实验

创作时间:
作者:
@小白创作中心

三门问题的数学原理及模拟实验

引用
1
来源
1.
https://tool.lu/fr_FR/article/1eg/preview

三门问题(Monty Hall problem)是一个源自博弈论的数学游戏,源自美国电视游戏节目Let's Make a Deal。问题描述为:参赛者面对三扇关闭的门,其中一扇门后是汽车,其他两扇门后是山羊。参赛者选择一扇门后,主持人会打开剩下两扇门中的一扇,露出一只山羊。此时,主持人问参赛者是否要更换选择。问题是:更换选择是否会增加赢得汽车的概率?

三门问题的概率表述

贝叶斯公式

贝叶斯公式是关于条件概率的公式。假设有事件A和事件B,它们地位等同。贝叶斯公式可以根据给定事件A时事件B的条件概率P(B|A)去计算给定事件B时事件A的条件概率P(A|B);或者反过来。贝叶斯公式的数学表示是:

$$
P(A|B) = \frac{P(B|A)P(A)}{P(B)}
$$

其中,P(A)是事件A的先验概率;P(B|A)是给定事件A时事件B的条件概率,在此一般称为后验概率;P(B)是事件B的先验概率,在此一般称为边缘概率;P(A|B)是给定时间B时事件A的条件概率。

三门问题的概率建模

在三门问题中,若有以下定义:

  • 事件A:参赛者选择的门后有汽车;
  • 事件B:主持人选择的门后有汽车。

则,根据贝叶斯公式,有:

$$
P(A|B) = \frac{P(B|A)P(A)}{P(B)}
$$

因此,问题转换为求解并判断后验概率P(A|B):

考虑P(B|A)表示已知参赛者选择的门后有汽车时,主持人选择的门后无汽车的概率,因为已知三扇门后只有一台汽车,因此P(B|A) = 1。又考虑到参赛者选择的门后有汽车的概率始终是1/3,因此问题实质上是要看边缘概率P(B)的值:

  • 若P(B) = 1/2,则P(A|B) = 1/3,答案是「否」;
  • 若P(B) = 1/3,则P(A|B) = 2/3,答案是「是」。

边缘概率P(B)之谜

两种答案

关于三门问题,两种答案争执已久。归纳起来,可以是:

  • 既然主持人排除了一个错误选项,那么原始问题就变成了二选一的新问题,此时选哪个都一样,中奖概率都是1/2。因此答案是「否」。
  • 三扇门的中奖概率都是1/3,参赛者选中的门的中奖概率自然也是1/3;而主持人选择的门打开后,1/3就「跑到」另一扇门上去了,所以另一扇门的中奖概率是2/3。因此答案是「是」。

暗藏的假设

根据贝叶斯公式,目标后验概率为P(A|B)。因此,以上两种答案对应边缘概率P(B)分别是1/2和1/3;这又对应了两种假设:

  • 主持人并不知道门后的情况,随机选择后恰好门后是羊;特别地,主持人不知道参赛者选择的门后的情况,因而主持人的选择没有带来新的信息量。即:P(B) = 1/2。
  • 主持人知道门后的情况,因此选择的门后边必然是羊;特别地,主持人知道参赛者选择的门后的情况,因而主持人的选择带来了新的信息量。即:P(B) = 1/3。

这两种假设即是长期持续的争论的直接原因,而其根源在于原始问题用模糊的语言玩了一个文字游戏。「节目主持人开启剩下两扇门的其中一扇」,并没有体现出主持人事先是否知道门后的情况;因而两种理解都算是可以接受的。这即是三门问题引起争论的原因,也是其陷阱所在。

破解谜题

尽管在原始问题中,有「文字游戏」的嫌疑,但由于「露出其中一只山羊」的保证,事实上主持人的选择就变成了确定性的结论,因而带来了信息量。以概率论的角度来描述,即是P(B) = 1/3。

因此,三门问题的答案,应当是「换另一扇门会增加参赛者赢得汽车的机会(概率从1/3增加到2/3)」。

回到小孩子的思维

行文至此,尽管已经从概率论的角度解答了原始问题,并给出了问题令人困惑的根本原因,但可能仍然有人拒绝这一反直觉的答案。为此,此处给出一个运用小孩子的思维的解法:枚举。

根据题目,参赛者需要在三扇门中进行选择,而门后共有一台汽车和两只羊。不妨将其设为:

  • 汽车
  • 羊A
  • 羊B

那么,若参赛者在主持人展示一只羊之后更改选择,则获胜的概率为2/3(失败的概率则是1/3)。所有可能的情况枚举如下:

  • 当参赛者一开始选择汽车时(1/3概率),不论主持人选择羊A还是羊B,若参赛者更换选择,都不能赢得汽车。
  • 当参赛者一开始选择羊A时(1/3概率),主持人必然选择羊B,若参赛者更换选择,则必然赢得汽车。
  • 当参赛者一开始选择羊B时(1/3概率),主持人必然选择羊A,若参赛者更换选择,则必然赢得汽车。

计算机模拟实验

所谓「实践是检验真理的唯一标准」,在给出了尽可能清晰的解答之后,本文也尝试用计算机模拟的方法,进行实践检验。

Python代码(在此下载)读起来很容易,因此不做详细说明,而只给出简单的解释。对于参赛者的两种选择(在主持人打开一扇门后是否更改选择),代码分别进行了10000轮,每轮1000次的实验。而后,代码统计每轮1000次实验中,参赛者成功赢得汽车的频率;并将10000轮频率绘制成图展示。

以下是「不更改」的实验结果。不难发现,频率分布在1/3左右,每轮实验的具体频率在它附近抖动。


以下是「更改」的实验结果。不难发现,频率分布在2/3左右,每轮实验的具体频率在它附近抖动。


据此,计算机模拟实验的结果,与前文分析的结果相同。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号