Bootstrap算法简介
创作时间:
作者:
@小白创作中心
Bootstrap算法简介
引用
CSDN
1.
https://blog.csdn.net/Wychee/article/details/140235267
Bootstrap算法帮助我们找到让我们表达信心的值。比如,"我们有98%的概率确定总体的均值在3.1和4.5之间"。这意味着我们知道区间的上界(3.1)和下届(4.5),并且我们对该值存在于该区间内信心的大小98%。
Bootstrap算法的基本步骤
Bootstrap包括两个基本步骤:
- 根据原始的总体创建一个样本集
- 对样本集进行重采样(resampling)以生成一些新数据集,而这些新数据集中的每一个都称为bootstrap
创建Bootstrap的具体过程
为了创建bootstrap,我们先要确定需要从初始样本集中选择多少元素。尽管我们通常使用较少的元素,但是理论上可以选择小于样本数据集的任意数量的元素。然后我们会从样本集中有放回地随机抽取多个元素,这意味着我们可能会多次选择相同的元素。
抽取必须是要放回的,因为我们想要构建与样本集大小相同的bootstrap。
示例说明
假设我们有总体1000个整数,其均值为500。我们从这个数据集中随机抽取500个值来创建一个样本集,然后又创建100个bootstrap,每个bootstrap包含20个元素。假设样本集均值490,bootstrap帮助我们确定:我们应该在多大程度上信任490这个值。
确定置信区间
如下图,我们可以绘制直方图,横坐标为bootstrap平均值,纵坐标为bootstrap数量。Bootstrap均值近似于高斯曲线。假设我们想要找打有着80%的置信区间,就只需要去掉bootstrap均值最低的10%的和最高的10%的bootstrap的数量。
热门推荐
3D打印创客教室:从创意到实践的创新教育模式
备战半马,平日跑量及配速怎样安排才有戏?
国图联合10家单位发布古籍数字资源,新增1700余部古籍
电力行业产业链的关键环节有哪些?
Altium Designer 20 PCB设计层详解
味觉盛宴双胞胎?菠萝和菠萝蜜区别一次说清楚
陈皮用沸水泡吗?正确方法与功效解析
升级流:网络文学中的成长逆袭之路
逆向工程是什么意思?逆向工程核心原理是什么?
吃什么可以控制甘油三酯
辛丑条约:晚清衰败的见证
揭秘挠痒痒之谜:为什么自己挠不痒,别人挠才痒?
洛邑:东周的辉煌印记
专家解读:新技术装备如何赋能应急救援
紫微斗数短命征兆解析:三大凶命格与影响因素
如何停止精神内耗,学会与自己和解
Excel表格公式结果复制方法全攻略
浅谈停车库的价值评估
周鸿祎:打工混日子将陷入社会底层,年轻人应抓住AI、自媒体和国际化机遇
两宋时期科举制是如何发展的?带来了什么样的影响?
清华大学团队在量子场论和全息原理交叉领域取得重要进展
PCB设计-每一层的含义(实物讲解 详细版)
Word文档无法输入文字?四种常见原因及解决方案
新生儿体温:正常范围与护理实用贴士
Excel公式计算结果粘贴方法详解:从基础操作到高级技巧
音乐创作中的著作权问题
挪威的森林:生命的迷失与觉醒
一篇文章看懂广义相对论,爱因斯坦是如何构建时空弯曲?
八字原局成势,八字原局信息的提取
深度丨谁是“大女主”?古装剧女主集体“升级”