Bootstrap算法简介
创作时间:
作者:
@小白创作中心
Bootstrap算法简介
引用
CSDN
1.
https://blog.csdn.net/Wychee/article/details/140235267
Bootstrap算法帮助我们找到让我们表达信心的值。比如,"我们有98%的概率确定总体的均值在3.1和4.5之间"。这意味着我们知道区间的上界(3.1)和下届(4.5),并且我们对该值存在于该区间内信心的大小98%。
Bootstrap算法的基本步骤
Bootstrap包括两个基本步骤:
- 根据原始的总体创建一个样本集
- 对样本集进行重采样(resampling)以生成一些新数据集,而这些新数据集中的每一个都称为bootstrap
创建Bootstrap的具体过程
为了创建bootstrap,我们先要确定需要从初始样本集中选择多少元素。尽管我们通常使用较少的元素,但是理论上可以选择小于样本数据集的任意数量的元素。然后我们会从样本集中有放回地随机抽取多个元素,这意味着我们可能会多次选择相同的元素。
抽取必须是要放回的,因为我们想要构建与样本集大小相同的bootstrap。
示例说明
假设我们有总体1000个整数,其均值为500。我们从这个数据集中随机抽取500个值来创建一个样本集,然后又创建100个bootstrap,每个bootstrap包含20个元素。假设样本集均值490,bootstrap帮助我们确定:我们应该在多大程度上信任490这个值。
确定置信区间
如下图,我们可以绘制直方图,横坐标为bootstrap平均值,纵坐标为bootstrap数量。Bootstrap均值近似于高斯曲线。假设我们想要找打有着80%的置信区间,就只需要去掉bootstrap均值最低的10%的和最高的10%的bootstrap的数量。
热门推荐
藏族丧葬习俗的社会功能探究
西藏独特葬礼习俗:天葬背后的生死观
用热血传递爱与希望:无偿献血全攻略
小学数学课堂:如何提升师生互动效果?
《经典蒙氏教具绘本》:让数学启蒙变得简单有趣
新学期小学数学教材大变脸!
新课改下小学数学课堂如何玩转信息技术?
汕头到漳州自驾游:打卡网红南澳岛!
汕头与漳州的文化碰撞:历史与现代交融
冬季武警院校搏击训练大揭秘!
零下20℃!看武警特战队员如何驭雪斗寒
蒙古族天葬:灵魂升天的秘密
蒙古族天葬:一种独特的生命告别方式
珠海航展明星:虎鲸无人艇引领未来海战
“虎鲸”无人艇:中国海军的新利器
连续两年入选全明星周末,王鹤棣如何成为NBA的破圈之匙
中医治疗阴虚高血压取得新突破
中医教你如何调理阴虚体质
香蕉真的能缓解腹痛吗?
低FODMAP饮食:科学应对腹部不适的饮食指南
东南大学附属中大医院推荐:中医食疗改善腹部不适
全年旅行时间揭秘:张家界的天门山四季旅游全解析
无偿献血证不过期!不仅能优先用血,还能血费报销
关于无偿献血,你想要了解的都在这里!
元旦南太行自驾游必备车辆检查清单
康博嘉诊所经营指南:必备法律事项
双十一囤货攻略:深海鱼油的选购与使用指南
吃鱼还是吃鱼油?最新研究揭示惊人真相!
派币2024年官方最新消息:已被列为高风险App,警惕各类虚假信息
藏传佛教:西藏文化的独特瑰宝