证明:特征值表示数据在对应特征向量方向上的方差且特征向量表示数据的主要方向
创作时间:
作者:
@小白创作中心
证明:特征值表示数据在对应特征向量方向上的方差且特征向量表示数据的主要方向
引用
CSDN
1.
https://m.blog.csdn.net/m0_53605808/article/details/144985373
协方差矩阵是机器学习和数据科学中的重要概念,其特征值和特征向量具有重要的统计意义。本文将证明协方差矩阵的特征值表示数据在对应特征向量方向上的方差,以及特征向量表示数据的主要方向。
协方差矩阵的定义
对于一个 n-维随机向量
,其协方差矩阵 Σ 定义为:
其中:
- μ = E[X] 是 X 的期望;
- Σ 是一个对称正定矩阵,大小为 n×n 。
协方差矩阵中的元素
表示
和
之间的协方差: - 当 i = j 时,
表示方差; - 当 i ≠ j 时,
表示特征
和
的线性相关性。
协方差矩阵的特征值和特征向量
协方差矩阵的特征值 λ 和特征向量 v 满足:
Σv = λv
其中:
- v 是协方差矩阵的特征向量;
- λ 是对应的特征值。
以下证明协方差矩阵的特征值和特征向量具有的两大性质。
性质 1:特征值表示数据在对应特征向量方向上的方差
(1)任意方向上的方差
对于数据 X ,任意方向 v 上的数据投影为:
数据在该方向上的方差为:
根据协方差的性质,方差可以写为:
(2)最大化方差
我们希望找到一个方向 v ,使得方差 Var(Y) 最大化:
这是一个典型的特征值分解问题。优化问题的解为协方差矩阵的特征向量 v ,最大方差为对应的特征值 λ 。
因此,协方差矩阵的特征值 λ 表示数据在对应特征向量方向 v 上的方差。
性质 2:特征向量表示数据的主要方向
(1)主要方向定义
主成分分析(PCA)的目标是找到数据分布变化最大的方向,也就是数据的“主要方向”。这一方向对应于协方差矩阵的第一主成分,其特征向量是:
(2)正交性质
协方差矩阵是对称的,特征向量具有正交性。因此,所有特征向量构成的方向是彼此独立的,可以用来描述数据的不同变化方向。
- 第一特征向量:对应最大的特征值,表示数据分布方差最大的方向。
- 第二特征向量:对应第二大特征值,表示次大的数据变化方向。
- 依此类推:特征向量按特征值大小排序,逐步描述数据的重要方向。
总结
- 特征值:协方差矩阵的特征值表示数据在对应特征向量方向上的方差大小。
- 特征向量:协方差矩阵的特征向量表示数据的主要变化方向,且这些方向彼此正交。
热门推荐
牛奶饮用全攻略:8个关键问题为您深度剖析
甘南7日深度游攻略:从拉卜楞寺到扎尕那,景点、路线、美食一网打尽
2024年南昌大学会计专硕(MPAcc)项目介绍
培训班中高效沟通交流对学习效果有何影响?
机油选择大作战,你选对了吗?
鸡胚胎发育阶段特点介绍:鸡胚胎发育成长过程
食品包装袋材质选择指南:六大材质特性与使用注意事项
青云传灵宗与剑宗,谁才是巅峰强者?
病历单申请流程及注意事项
孕妇可以喝杨枝甘露吗?孕期“享用”杨枝甘露的秘诀与自制方法
什么是艺术手法,艺术手法有哪些?
韦纳的归因理论及其应用
为了保护我们的肾脏健康,这5件日常事,真的不要再做了!
Mysteel解读:产能过剩与内外平衡——基于钢材出口量调整的分析
基本面分析在股票市场的重要性
乔鲁诺·乔巴纳:黄金精神的继承者与梦想实现者
揭秘数字货币:比特币背后的技术逻辑
【全台博物馆】馆内特色&博物馆门票优惠!深入艺术及自然科学研究
人工智能与自然语言处理在大数据分析中的应用与未来趋势探讨
仡佬族“三幺台”:千年饮食文化的传承
不懂钓鱼的人,永远不知道钓鱼人的快乐!
匀变速运动:从汽车加速到火箭发射,揭秘生活中的运动规律
如何降低海运过程中货物包装损坏的风险?
分析FBA海运中货代对破损货物不进行赔偿的原因
分压电路的计算方式与应用场景
天热家里使用蚊香液要当心,很多人都用错了,看完记得叮嘱家里人
北京旅游景点Top10终极排名|本地人认证版+隐藏玩法全解析
命运石之门主要角色介绍
豆渣的功效与作用、禁忌和食用方法
阳光型抑郁症的程度分析