证明:特征值表示数据在对应特征向量方向上的方差且特征向量表示数据的主要方向
创作时间:
作者:
@小白创作中心
证明:特征值表示数据在对应特征向量方向上的方差且特征向量表示数据的主要方向
引用
CSDN
1.
https://m.blog.csdn.net/m0_53605808/article/details/144985373
协方差矩阵是机器学习和数据科学中的重要概念,其特征值和特征向量具有重要的统计意义。本文将证明协方差矩阵的特征值表示数据在对应特征向量方向上的方差,以及特征向量表示数据的主要方向。
协方差矩阵的定义
对于一个 n-维随机向量
,其协方差矩阵 Σ 定义为:
其中:
- μ = E[X] 是 X 的期望;
- Σ 是一个对称正定矩阵,大小为 n×n 。
协方差矩阵中的元素
表示
和
之间的协方差: - 当 i = j 时,
表示方差; - 当 i ≠ j 时,
表示特征
和
的线性相关性。
协方差矩阵的特征值和特征向量
协方差矩阵的特征值 λ 和特征向量 v 满足:
Σv = λv
其中:
- v 是协方差矩阵的特征向量;
- λ 是对应的特征值。
以下证明协方差矩阵的特征值和特征向量具有的两大性质。
性质 1:特征值表示数据在对应特征向量方向上的方差
(1)任意方向上的方差
对于数据 X ,任意方向 v 上的数据投影为:
数据在该方向上的方差为:
根据协方差的性质,方差可以写为:
(2)最大化方差
我们希望找到一个方向 v ,使得方差 Var(Y) 最大化:
这是一个典型的特征值分解问题。优化问题的解为协方差矩阵的特征向量 v ,最大方差为对应的特征值 λ 。
因此,协方差矩阵的特征值 λ 表示数据在对应特征向量方向 v 上的方差。
性质 2:特征向量表示数据的主要方向
(1)主要方向定义
主成分分析(PCA)的目标是找到数据分布变化最大的方向,也就是数据的“主要方向”。这一方向对应于协方差矩阵的第一主成分,其特征向量是:
(2)正交性质
协方差矩阵是对称的,特征向量具有正交性。因此,所有特征向量构成的方向是彼此独立的,可以用来描述数据的不同变化方向。
- 第一特征向量:对应最大的特征值,表示数据分布方差最大的方向。
- 第二特征向量:对应第二大特征值,表示次大的数据变化方向。
- 依此类推:特征向量按特征值大小排序,逐步描述数据的重要方向。
总结
- 特征值:协方差矩阵的特征值表示数据在对应特征向量方向上的方差大小。
- 特征向量:协方差矩阵的特征向量表示数据的主要变化方向,且这些方向彼此正交。
热门推荐
等离子切割机使用指南:原理、操作到维护全解析
景福宫修缮启动,揭秘故宫古建保护秘籍
故宫博物院最新展览:紫禁城的秘密
故宫小众打卡攻略:避开人流,解锁不一样的紫禁城
权威研究:靠墙蹲降压效果最佳
平成昭和10元硬币收藏指南:从入门到精通
储存不当易变毒,干木耳这样保存最安全
密封、冷藏、晾晒:让干木耳储存更持久
矿井缺氧致伤亡频发,智能系统助力安全防护
职场心理缺氧:成因、类型与应对指南
突发缺氧怎么办?这份急救手册请收好
5 个护理肾脏的饮水小贴士
胸痛莫轻视:冠心病的早期预防与应急指南
解码高管心口痛:心理压力如何影响身体健康
胸口痛别轻视:心肌缺血的早期症状与应对方法
绿豆汤、菊花茶:六种食物缓解心口疼痛
炎症监测加他汀治疗,及早预防颈动脉粥样硬化
北大研究揭示:近四分之一中国成年人有颈动脉粥样硬化
地中海饮食显优势,科学证实可延缓颈动脉硬化
面食制作技巧大公开,新手也能变大厨!
“翠湖八景”邂逅聂耳文化,昆明华山西路站成文化新地标
魔术师中的魔术师——布莱特·丹尼尔斯
揭秘魔术师的心理秘招:他们如何愚弄我们的感官?
告别学习动力不足,这10招让孩子重燃学习热情
股票投资风险管理:专家教你规避风险,稳健投资
元朝著名文人,诗画双绝,倪瓒十首诗,彰显冲淡之美,题画诗最好
红曲燕麦牛油果洋葱:四种食物助力降脂
蛋黄与甘油三酯的关系真相:每周吃3-4个鸡蛋最健康
开封市人民医院中医专家提出高血脂综合调理新方案
职场情绪管理:如何赢得老板认可?