ML基本知识01——正态分布
创作时间:
作者:
@小白创作中心
ML基本知识01——正态分布
引用
CSDN
1.
https://blog.csdn.net/matthewchen123/article/details/107646603
正态分布,又称高斯分布,是统计学和机器学习中最重要的概率分布之一。本文将从正态分布的定义、特点、标准正态分布以及其广泛应用的原因等方面进行介绍。
正态分布
正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布。遵从正态分布的随机变量的概率规律为取 μ邻近的值的概率大 ,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。
正态分布是一种概率分布,有两个参数μ和σ^2.
两参数的连续型随机变量的分布。
第一参数μ:
遵从正态分布的随机变量的均值
第二个参数σ^2:
是此随机变量的方差,所以正态分布记作N(μ,σ^2 )。
正态分布特点:
- 密度函数关于平均值对称
- 平均值与它的众数(statistical mode)以及中位数(median)同一数值。
- 函数曲线下68.268949%的面积在平均数左右的一个标准差范围内。95.449974%的面积在平均数左右两个标准差的范围内。99.730020%的面积在平均数左右三个标准差的范围内。99.993666%的面积在平均数左右三个标准差的范围内。
标准正态分布
标准正态分布(standard normal distribution)称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。
为什么正太分布应用广泛
中心极限定理(centeallimit theorem)
大数定律揭示了大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。而中心极限定理说明的是在一定条件下,大量独立随机变量的平均数是以正态分布为极限的。在自然界与生产中,一个事件(一个现象)受到许多相互独立的随机因素的影响,每个因素所产生的影响都不非常显著时,但是这些因素之间又有关联,最终这些因素对时间的总影响会使得大量独立随机变量的平均数可以看作是服从正态分布的。
设从均值为μ、方差为σ2;有限的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布。
热门推荐
中国最小姓氏“贶”:全国不足百人,很多人见了都不会读
优良的荒山造林绿化树种有哪些?
探秘历史长河,国历与农历——两种时间认知的交织与演变
浪淘沙诗句中的宝塔怒火烧是何意?
突发性头晕恶心呕吐的原因及处理方法
假期锻炼,享受运动带来的快乐与健康
胃息肉通过什么能检查出来
莫泊桑:法国现实主义文学的瑰宝
正切函数的图像和性质
初中语文阅读理解提分攻略:四大实用方法助力阅读能力提升
200米跑步技巧:从跑姿到心理调整的全方位指南
番红花:珍贵的中药材与香料
拔火罐后皮肤出现黑紫色印记?医生详解原因及注意事项
凡士林:从性质到应用的全面解析
谷维素副作用是什么
谷维素和维生素B1治什么病
龙胆泻肝丸对肝肾有损害吗?医生专业解析
配音小说视频:开启音频阅读的新境界
人中彭祖 泉中五铢
五铢钱:中国历史上流通时间最长的铜制货币
蒸西兰花要蒸多久才熟?一文详解影响蒸制时间的关键因素
河道水质在线监测系统:及时发现水质污染问题
如何促进肠胃蠕动
腰背痛做什么检查最好
老年人低钠血症危机:如何通过饮食调整重获健康活力?
记者:阿曼队飞抵河内两主力因伤缺席 也将无缘对阵中国的比赛
米饭和面食,谁才是热量“冠军”?
汉朝的历史知识
李为民教授团队最新成果:内科胸腔镜—不止于诊断
各省市邹氏人口总数及其排名