问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

MATLAB 相关性分析方法 - 新手小白教程

创作时间:
作者:
@小白创作中心

MATLAB 相关性分析方法 - 新手小白教程

引用
1
来源
1.
https://www.xinlian88.tech/h-nd-1480.html

相关性分析简介

相关性分析是一种评估两个或多个相关变量之间密切程度的方法,它需要这些变量之间存在一定的关联或概率。其中一种常见的方法是使用Pearson相关系数来衡量这种相关性。

算法详解

以大学线性数学水平理解,相关性分析可以类比为两组数据的向量夹角的余弦值,用来衡量它们之间的关系密切程度。Pearson相关系数是常见的用来衡量相关性的方法,有以下三种等价的公式:

皮尔森相关系数用于衡量两个连续变量(X和Y)之间线性关联程度的方法。它的公式定义为:将这两个变量的协方差(cov(X,Y))除以它们各自标准差的乘积(σX, σY)。该系数的取值范围始终在-1到1之间。接近0的系数表示变量间无关联,接近1或-1表示具有正向或负向强关联。

适用于皮尔森相关系数的条件如下:

  • 两个变量之间存在线性关系,并且这些变量是连续数据。
  • 两个变量的总体分布是正态分布,或者至少接近正态分布的单峰分布。
  • 观测值是成对的,即每个X值都有对应的Y值,并且每对观测值之间是相互独立的。

在满足上述条件后,以下是使用corr函数来计算三种相关系数的示例:

  • 当X和Y构成一个矩阵时,计算两者的相关系数:correlation_coefficient = corr(X, Y, 'type', 'Pearson')
  • 当X是一个包含多个指标数据的矩阵时,计算指标之间的相关系数:correlation_matrix = corr(X, 'type', 'Pearson')

程序实现

示例数据

输入代码

得到结果

通过计算得到的相关系数矩阵显示,所分析的数据似乎存在高度的线性关联,但也出现了异常值。

总结

通过本章,我们了解了相关性分析作为一种方法,即Pearson相关系数。Pearson相关系数可以用于衡量线性关联,并在-1到1的范围内取值,接近0表示无关联,接近1或-1表示正向或负向强关联。然而,在演示的数据中,计算得到的相关系数矩阵出现了异常值,可能需要对数据的准确性和处理方法进行进一步的检查和处理。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号