证明:特征值表示数据在对应特征向量方向上的方差且特征向量表示数据的主要方向
创作时间:
作者:
@小白创作中心
证明:特征值表示数据在对应特征向量方向上的方差且特征向量表示数据的主要方向
引用
CSDN
1.
https://m.blog.csdn.net/m0_53605808/article/details/144985373
协方差矩阵是机器学习和数据科学中的重要概念,其特征值和特征向量具有重要的统计意义。本文将证明协方差矩阵的特征值表示数据在对应特征向量方向上的方差,以及特征向量表示数据的主要方向。
协方差矩阵的定义
对于一个 n-维随机向量
,其协方差矩阵 Σ 定义为:
其中:
- μ = E[X] 是 X 的期望;
- Σ 是一个对称正定矩阵,大小为 n×n 。
协方差矩阵中的元素
表示
和
之间的协方差: - 当 i = j 时,
表示方差; - 当 i ≠ j 时,
表示特征
和
的线性相关性。
协方差矩阵的特征值和特征向量
协方差矩阵的特征值 λ 和特征向量 v 满足:
Σv = λv
其中:
- v 是协方差矩阵的特征向量;
- λ 是对应的特征值。
以下证明协方差矩阵的特征值和特征向量具有的两大性质。
性质 1:特征值表示数据在对应特征向量方向上的方差
(1)任意方向上的方差
对于数据 X ,任意方向 v 上的数据投影为:
数据在该方向上的方差为:
根据协方差的性质,方差可以写为:
(2)最大化方差
我们希望找到一个方向 v ,使得方差 Var(Y) 最大化:
这是一个典型的特征值分解问题。优化问题的解为协方差矩阵的特征向量 v ,最大方差为对应的特征值 λ 。
因此,协方差矩阵的特征值 λ 表示数据在对应特征向量方向 v 上的方差。
性质 2:特征向量表示数据的主要方向
(1)主要方向定义
主成分分析(PCA)的目标是找到数据分布变化最大的方向,也就是数据的“主要方向”。这一方向对应于协方差矩阵的第一主成分,其特征向量是:
(2)正交性质
协方差矩阵是对称的,特征向量具有正交性。因此,所有特征向量构成的方向是彼此独立的,可以用来描述数据的不同变化方向。
- 第一特征向量:对应最大的特征值,表示数据分布方差最大的方向。
- 第二特征向量:对应第二大特征值,表示次大的数据变化方向。
- 依此类推:特征向量按特征值大小排序,逐步描述数据的重要方向。
总结
- 特征值:协方差矩阵的特征值表示数据在对应特征向量方向上的方差大小。
- 特征向量:协方差矩阵的特征向量表示数据的主要变化方向,且这些方向彼此正交。
热门推荐
最高法最新解读:代位求偿在保险理赔中的关键作用
石狮法院教你如何用代位求偿维权
胸口疼痛部位对照表:精准识别
曼陀罗花的神秘象征与深远寓意(探索曼陀罗花的精神之旅)
全脂牛奶vs脱脂牛奶:高血压患者的饮食新选择
高血压患者必知!高钠食品黑名单大揭秘
学会这3招,轻松应对情绪困扰!
打麻将真的能缓解情绪吗?哈佛80年研究给出惊人答案!
"兵马俑门票政策:儿童是否需要购票及收费标准"
古代避孕大法VS现代避孕神器:谁更靠谱?
理想旁路二极管:智能化光伏组件的关键创新
碧根果:心脏健康的秘密武器?
碧根果真的能护心?科学研究揭示其惊人效果!
PFC电路中旁路二极管的关键作用与设计要点
PFC旁路二极管:汽车电路的关键守护者
《难哄》教你掌握恋爱见面技巧
办公室恋情分手后,如何优雅地面对职场社交?
分手后如何保持心理健康:从专业建议到实际案例
分手后如何快速恢复?这6个情绪阶段帮你走出阴霾!
秋冬囤货必备:如何正确保存碧根果?
如何设计一张数据库表
碧根果:天然的情绪调节剂
氮化硼:高科技领域的“全能选手”
黄翡翠的招财效果与寓意:揭秘其风水作用及选购要点
秋冬肠道健康的守护者:双歧杆菌三联活菌使用全攻略
了解生成式 AI 的技术生态系统
单词candle的多种含义与用法
你真的知道一个番茄钟是多长时间吗?详解番茄工作法的时间管理技巧
侯智薰教你用邀请函加强职场内部沟通
中国如何培养气候世代