问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

欧拉37%法则:理性决策的最佳策略

创作时间:
作者:
@小白创作中心

欧拉37%法则:理性决策的最佳策略

引用
CSDN
1.
https://m.blog.csdn.net/howard2005/article/details/143829855

欧拉37%法则,也称37%法则或最优停止理论,是一种决策策略,用于在不确定性下做出最优选择。例如在一系列相亲中,前37%的候选人仅用于观察,之后一旦遇到比之前所有人都好的,就选择那个人。该法则旨在最大化选择最佳选项的概率。

1. 欧拉37%法则概述

欧拉37%法则,也称37%法则或最优停止理论,是一种决策策略,用于在不确定性下做出最优选择。例如在一系列相亲中,前37%的候选人仅用于观察,之后一旦遇到比之前所有人都好的,就选择那个人。该法则旨在最大化选择最佳选项的概率。

2. 欧拉37%法则推导

2.1 问题提出与策略设定

假设一片玉米地有n个玉米。策略是先拒掉前面k个玉米(不去管这些玉米有多大),然后从第k+1个玉米开始,一旦看到比之前所有玉米都要大的,就毫不犹豫地选择它。这里k的取值很关键,太小了达不到尝试的效果,太大了又会导致真正可选的余地不多了。所以需要确定在n已知的情况下,k取何值时,按此策略选中最大玉米的概率最大。

2.2 概率公式构建

设k是定值,如果最适合的玉米出现在了第i个位置,k的概率记作P(k)。那么:

$$
P(k)=\sum_{i=k + 1}^{n}\frac{1}{n} \cdot \frac{k}{i - 1}=\frac{k}{n}\sum_{i=k + 1}^{n}\frac{1}{i - 1}
$$

2.3 公式近似处理

令x表示k/n的值,并且假设n充分大,此时上述公式可近似为:

$$
P(k)=x\int_{1}^{x}\frac{1}{t}dt=-x\cdot\ln x
$$

2.4 求最优值

对$-x\cdot\ln x$求导,并令这个导数为0,可以解出x的最优值。求导可得:

$$
-\ln x - x\cdot\frac{1}{x}=-\ln x - 1
$$

令其为0,则$\ln x = -1$,从而解得$x = \frac{1}{e}$。

2.5 得出37%法则

由于$\frac{1}{e}\approx0.37(e\approx2.718281828459)$,所以该法则也叫做37%法则。

也就是说,按照这个法则,在前37%的观察阶段只看不选,记住最大的样本情况,在后面的阶段中,一旦遇到比前面观察到的最大样本还要大或差不多大的,就选择它,这样能在类似的随机选择场景下尽可能选到较优的结果。但需要注意的是,37%法则并不能保证一定能选到最优的结果,只是一种基于概率的较优策略。

3. 欧拉37%法则应用

欧拉37%法则,也称为最优停止理论,是一种在不确定性条件下进行决策的数学策略。它起源于秘书问题,即如何在一系列候选人中选择最佳秘书的问题。这个法则不仅在理论上具有深刻的意义,而且在实际生活中也有广泛的应用。

3.1 经济学与金融领域的应用

在经济学和金融领域,最优停止理论被广泛应用于美式期权的交易中。投资者需要决定何时执行看涨或看跌期权以获得最大收益。通过使用最优停止理论,投资者可以更科学地制定决策,减少因市场波动带来的不确定性和风险。

3.2 行政文秘工作中的应用

在行政文秘工作中,信息管理是一个重要且繁琐的任务。通过建立完善的信息管理体系和采用信息处理软件,可以提高信息处理的效率和准确性。此外,培养信息处理能力,通过培训课程提高信息技能,也是应用37%法则的一种体现,即在观察和学习阶段积累经验,然后在决策阶段快速准确地处理信息。

3.3 个人生活中的应用

3.3.1 购房决策

在购房过程中,我们可以将37%法则应用于看房和决策过程。例如,如果你设定一个月内必须买到房子,那么前11天(即37%的时间)用于观察市场,了解你喜欢和不喜欢的房子,并记住最满意的房子。从第12天开始,一旦遇到比之前最满意的房子更好的选项,就毫不犹豫地购买。

3.3.2 择偶决策

在择偶问题上,37%法则同样适用。假设一个女性从20岁开始寻找伴侣,目标是在30岁前结婚,那么根据37%法则,23.7岁是观察期和决策期的分界点。在20岁到23.7岁之间,她应该只交往不结婚,但要记住最喜欢的那个人。23.7岁之后,一旦遇到一个比之前最喜欢的人还好或者差不多好的人,就应该选择和他结婚。

3.4 决策理论中的应用

最优停止理论在决策理论中提供了一个理性的框架,帮助我们在面对多个选择时,如何平衡探索和利用的关系。通过设定一个观察期,我们可以收集信息并确定一个基准,然后在决策期利用这些信息来做出最佳选择。

综上所述,欧拉37%法则不仅是一种理论上的数学模型,也是一种实际生活中理性决策的最佳策略。它帮助我们在不确定性中寻找确定性,减少决策的纠结和痛苦,提高决策的效率和效果。

秘书问题

在所有最优停止问题中,最大的难点不在于选择哪一种可选方案,而是确定自己需要考虑多少种可选方案。这些问题往往会引发不同的后果,不仅陷入爱河的人和需要租房的人必须慎重考虑,司机、房主、入室行窃者等也常常面临同样的抉择。

“37%法则”源于所谓的“秘书问题”——最优停止问题中最著名的一类难题。秘书问题的情境与我们前面考虑过的租房难题十分相似。假设一堆人申请一个秘书岗位,而你是面试官,你的目标是从这堆申请人中遴选出最佳人选。你不知道如何给每一名申请人评分,但是可以轻松地判断哪一名申请人更加优秀。(用数学语言来表述,就是说你只能看到序数,即申请人相互比较的排名,但是无法看到基数,即在一般性评分标准下的得分。)你按照随机顺序,每次面试一名申请人。你随时可以决定将这份工作交给其中一人,而对方只能接受,于是面试工作就此结束。但是,一旦你否决其中一名申请人,就不能改变主意再回头选择他。

普遍认为,秘书问题第一次出现在出版物中是在1960年2月,那一期的《科学美国人》杂志在马丁·伽德纳最喜欢的栏目——“趣味数学”专栏中刊登了几个难题,其中之一就是秘书问题,不过当时没有明确地提到“秘书”这个词。但是,这个问题到底从何而来,这是一个非常神秘的谜。除了一些推测以外,初期的调查没有任何确凿的结论。随后,我们风尘仆仆地赶到斯坦福大学,查阅伽德纳的文书档案。伽德纳在20世纪中期留下来的那一盒盒书信,出乎意料地把我们的调查变成了侦探工作。阅读书信有点儿像偷听别人打电话,你只能听到通话一方所说的话,因此需要推断另一方到底说了什么。从这些回信看,大约50年前,伽德纳本人似乎正在调查秘书问题的来源。但是,看完这些书信,我们更是一头雾水了。

哈佛大学数学家弗雷德里克·莫斯特勒回忆说,1955年,他听同事安德烈·格里森提到过这个问题,而格里森又是从其他人那里听说的。阿尔伯塔大学的里奥·莫泽在信中说,他曾经在波音公司R.E.加斯克尔的“笔记”中看到过这个问题,而加斯克尔本人则说他是从一位同事那里听说的。罗格斯大学的罗杰·平克汉姆称,他是1955年从杜克大学数学家J.舍恩菲尔德那里第一次听说秘书问题的,他还说:“我记得,他说他是从密歇根大学的某个人那里听说的。”

几乎可以肯定,“密歇根大学的某个人”其实就是梅里尔·弗拉德。尽管在数学界以外几乎没有人知道弗拉德,但是他对计算机科学的影响很难被忽略。他把“旅行商问题”变成了一个广为人知的内容,还设计了“囚徒的困境”,甚至“软件”(software)一词也可能是他造出来的。1958年,他成了已知的第一个发现37%法则的人,同时他宣称,他从1949年就开始考虑这个问题了。但是,在说到最初来源时,弗拉德本人提到了另外几名数学家。

秘书问题是一个近乎完美的数学难题:问题本身表述简单,解题难度非常高,答案简洁明了,而影响力又足以让人产生浓厚的兴趣。因此,通过人们的口口相传,这个问题以燎原之势在20世纪50年代的数学界迅速蔓延开来。1960年,在伽德纳专栏的推波助澜之下,它又大大地激发了普通大众的想象力。至20世纪80年代,秘书问题已经变成了一个研究分支,无数人撰文讨论这个问题及与其相关的变体。

至于这个问题是如何与秘书产生联系的,这是一个非常有意思的过程——每种文化的社会偏爱都会对社会的形式系统产生影响。例如,在我们的心中国际象棋是中世纪欧洲人的象征,但是实际上国际象棋起源于8世纪的印度。15世纪,粗暴的“欧洲化”过程把沙阿(即国王)变成了王,维齐尔(即高官)变成了王后,而大象则成了基督教主教的形象。最优停止问题同样有多种不同化身,每种化身都是当时关注热点的某种反映。19世纪,最优停止问题的典型形式是巴洛克彩票和女性挑选求婚者的行为;20世纪初,常见的表现形式是驾车度假的人挑选宾馆、男性选择约会对象;在官僚作风盛行、男性占主导地位的20世纪中叶,最典型的最优停止问题是讨论男性老板如何挑选女性助手的问题。第一次明确提出“秘书问题”的是发表于1964年的一篇论文,自此之后,这个名称就再也没有发生变化。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号