证明:特征值表示数据在对应特征向量方向上的方差且特征向量表示数据的主要方向
创作时间:
作者:
@小白创作中心
证明:特征值表示数据在对应特征向量方向上的方差且特征向量表示数据的主要方向
引用
CSDN
1.
https://m.blog.csdn.net/m0_53605808/article/details/144985373
协方差矩阵是机器学习和数据科学中的重要概念,其特征值和特征向量具有重要的统计意义。本文将证明协方差矩阵的特征值表示数据在对应特征向量方向上的方差,以及特征向量表示数据的主要方向。
协方差矩阵的定义
对于一个 n-维随机向量
,其协方差矩阵 Σ 定义为:
其中:
- μ = E[X] 是 X 的期望;
- Σ 是一个对称正定矩阵,大小为 n×n 。
协方差矩阵中的元素
表示
和
之间的协方差: - 当 i = j 时,
表示方差; - 当 i ≠ j 时,
表示特征
和
的线性相关性。
协方差矩阵的特征值和特征向量
协方差矩阵的特征值 λ 和特征向量 v 满足:
Σv = λv
其中:
- v 是协方差矩阵的特征向量;
- λ 是对应的特征值。
以下证明协方差矩阵的特征值和特征向量具有的两大性质。
性质 1:特征值表示数据在对应特征向量方向上的方差
(1)任意方向上的方差
对于数据 X ,任意方向 v 上的数据投影为:
数据在该方向上的方差为:
根据协方差的性质,方差可以写为:
(2)最大化方差
我们希望找到一个方向 v ,使得方差 Var(Y) 最大化:
这是一个典型的特征值分解问题。优化问题的解为协方差矩阵的特征向量 v ,最大方差为对应的特征值 λ 。
因此,协方差矩阵的特征值 λ 表示数据在对应特征向量方向 v 上的方差。
性质 2:特征向量表示数据的主要方向
(1)主要方向定义
主成分分析(PCA)的目标是找到数据分布变化最大的方向,也就是数据的“主要方向”。这一方向对应于协方差矩阵的第一主成分,其特征向量是:
(2)正交性质
协方差矩阵是对称的,特征向量具有正交性。因此,所有特征向量构成的方向是彼此独立的,可以用来描述数据的不同变化方向。
- 第一特征向量:对应最大的特征值,表示数据分布方差最大的方向。
- 第二特征向量:对应第二大特征值,表示次大的数据变化方向。
- 依此类推:特征向量按特征值大小排序,逐步描述数据的重要方向。
总结
- 特征值:协方差矩阵的特征值表示数据在对应特征向量方向上的方差大小。
- 特征向量:协方差矩阵的特征向量表示数据的主要变化方向,且这些方向彼此正交。
热门推荐
海宁旅游景点大全:必去景点与详细攻略
凉皮的热量
食品中的干燥剂会不会爆炸?化学老师提醒:石灰类干燥剂存在两种危险
利润表反映什么?利润表对企业决策有哪些影响?
医生竟让我用可乐送服药品?——服药用水有讲究
对话星海湖:知否知否,应是“鱼肥湖瘦”
揭秘古代女宦官:生活在夹层中的宫廷女性
手术后发烧怎么办?原因、处理和预防全攻略
术后发烧全解析:何时易发?如何应对?
摩托车被法院执行了有赔偿吗
摩托被人砸了怎么办赔偿
凤凰吉祥:探索幸福生活的象征与意义
厦门房价趋势与学区房市场分析
怎么区分血友病和获得性血友病的区别
这种明显升高尿酸的饮品,很多人都忽视了
LED显示屏接口大揭秘:DVI与VGA,谁是高清视界的幕后英雄?
让图像亮度不再是难题:伽马变换的神奇力量
重阳节:赏菊读诗,重拾岁月温情
重阳节:农历九月初九,中国传统节日!
宏观经济政策对股市的影响
供销大集三年摘帽记:从濒临退市到成功逆袭
一文看懂新能源汽车电池技术的现在和未来
清朝大臣苏克萨哈和鳌拜因何而争斗不休?
网络安全如何反渗透
现场投票环节设计的创新方法
烧烤店如何打造符合市场需求的整体设计方案?(烧烤店策划设计方案)
寒假如何与孩子相处?15条专业建议预防和孩子“谈崩”
运动前必做热身动作!《养生功法八段锦》教您正确热身
工作移民澳洲后,如何提升自己的职场竞争力以应对可能的变化?
2024年澳大利亚毕业生收入$75000/年!这些行业薪资最高