ML基本知识01——正态分布
创作时间:
作者:
@小白创作中心
ML基本知识01——正态分布
引用
CSDN
1.
https://blog.csdn.net/matthewchen123/article/details/107646603
正态分布,又称高斯分布,是统计学和机器学习中最重要的概率分布之一。本文将从正态分布的定义、特点、标准正态分布以及其广泛应用的原因等方面进行介绍。
正态分布
正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布。遵从正态分布的随机变量的概率规律为取 μ邻近的值的概率大 ,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。
正态分布是一种概率分布,有两个参数μ和σ^2.
两参数的连续型随机变量的分布。
第一参数μ:
遵从正态分布的随机变量的均值
第二个参数σ^2:
是此随机变量的方差,所以正态分布记作N(μ,σ^2 )。
正态分布特点:
- 密度函数关于平均值对称
- 平均值与它的众数(statistical mode)以及中位数(median)同一数值。
- 函数曲线下68.268949%的面积在平均数左右的一个标准差范围内。95.449974%的面积在平均数左右两个标准差的范围内。99.730020%的面积在平均数左右三个标准差的范围内。99.993666%的面积在平均数左右三个标准差的范围内。
标准正态分布
标准正态分布(standard normal distribution)称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。
为什么正太分布应用广泛
中心极限定理(centeallimit theorem)
大数定律揭示了大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。而中心极限定理说明的是在一定条件下,大量独立随机变量的平均数是以正态分布为极限的。在自然界与生产中,一个事件(一个现象)受到许多相互独立的随机因素的影响,每个因素所产生的影响都不非常显著时,但是这些因素之间又有关联,最终这些因素对时间的总影响会使得大量独立随机变量的平均数可以看作是服从正态分布的。
设从均值为μ、方差为σ2;有限的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布。
热门推荐
安卓手机如何恢复删除的照片?
土地增值税是什么意思
科目三考试结束后,是先拉手刹还是先熄火?别等到挂科才知道后悔
调查发现:老年人若每天吃辣椒,用不了多久,身体或有这几种改善
都江堰:千年古堰的奥秘,你了解多少?
都江堰:秦朝的伟大水利工程
如何应对医疗保险中断情况?医疗保险中断的影响有哪些?
蒙恬遗言:触动曹操之心,启迪后人敬仰
玻璃陶瓷加热板常见故障及解决方法
广州南站:900多台手机无人认领!12306可查询
卫青之死与家族的覆灭:历史的悲剧与教训
物流客户满意度提升全攻略:从影响因素到改进方案
血型奥秘:O型父母与子女的血型关系
青平:接烈士遗骸归国,告慰英雄更要传承精神
营业执照办理条件及要求
粉色灵感 | 室内设计中的氛围营造、身份表达与实验探索
当我们吃年夜饭时,到底在吃什么
租客不交租金又不搬走怎么办
全国人大代表刘晓静:破局高校科研成果转化困境 构建产学研深度融合的创新生态体系
消费欺诈案件解析:如何识别与防范消费陷阱
消费者权益保护法:消费者的八大权利与三大义务
水泥电阻发热的原因及处理方法
水泥电阻:稳定性与可靠性,电子工程中的重要组成部分
人-AI协同如何重塑未来战争?
搞清楚哪些茶助眠、哪些茶致失眠很关键!
立春之后,喝什么茶最养生?
睡了等于没睡?这样睡觉,危害堪比熬夜
探索细胞器的神秘世界:它们在细胞中的作用与重要性
精准论证,直击要害:掌握论证方法,提升表达说服力
实验技术 | 如何设计PCR引物——详细步骤指南