时间序列平稳性的双重假设检验:KPSS与ADF方法比较研究
创作时间:
作者:
@小白创作中心
时间序列平稳性的双重假设检验:KPSS与ADF方法比较研究
引用
CSDN
1.
https://blog.csdn.net/deephub/article/details/145299165
在进行时间序列分析之前,确定序列的平稳性是一个关键步骤。平稳性指的是时间序列的统计特性(如均值和方差)在时间维度上保持不变。本文将详细介绍如何运用KPSS 检验和Dickey-Fuller 检验来验证序列的平稳性。这两种检验方法基于不同的统计假设:KPSS 检验的原假设是数据非平稳,而 Dickey-Fuller 检验则假设数据平稳。
时间序列平稳性的基本概念
时间序列的平稳性主要体现在三个方面:
- 均值稳定性:序列的期望值在时间维度上保持恒定
- 方差稳定性:数据波动范围保持相对稳定
- 无周期性:数据不存在明显的周期性波动或循环模式
平稳性是许多时间序列模型(如 ARIMA)的基本假设条件,对模型的有效性具有重要影响。
以下我们将通过构造平稳序列和非平稳序列来演示这两种检验方法的应用。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.stattools import adfuller, kpss
# 构造平稳时间序列(白噪声过程)
np.random.seed(42)
stationary_series = np.random.normal(loc=0, scale=1, size=500)
# 构造非平稳时间序列(随机游走过程)
non_stationary_series = np.cumsum(np.random.normal(loc=0, scale=1, size=500))
# 创建数据框用于后续分析
data = pd.DataFrame({
"Stationary": stationary_series,
"Non-Stationary": non_stationary_series
})
plt.figure(figsize=(12, 6))
plt.plot(data['Stationary'], label='Stationary Series')
plt.plot(data['Non-Stationary'], label='Non-Stationary Series')
plt.title('Stationary vs Non-Stationary Time Series')
plt.xlabel('Time')
plt.ylabel('Value')
plt.legend()
plt.grid()
plt.savefig('stationary_vs_non_stationary.png')
plt.show()
def kpss_test(series):
statistic, p_value, _, critical_values = kpss(series, regression='c')
print("KPSS Test:")
print(f"Statistic: {statistic:.4f}")
print(f"P-Value: {p_value:.4f}")
print("Critical Values:")
for key, value in critical_values.items():
print(f"{key}: {value:.4f}")
print(f"Conclusion: {'Stationary' if p_value > 0.05 else 'Non-Stationary'}\n")
def adf_test(series):
statistic, p_value, _, _, critical_values, _ = adfuller(series)
print("Dickey-Fuller Test:")
print(f"Statistic: {statistic:.4f}")
print(f"P-Value: {p_value:.4f}")
print("Critical Values:")
for key, value in critical_values.items():
print(f"{key}: {value:.4f}")
print(f"Conclusion: {'Stationary' if p_value < 0.05 else 'Non-Stationary'}\n")
print("Testing the Stationary Series:\n")
kpss_test(data['Stationary'])
adf_test(data['Stationary'])
print("Testing the Non-Stationary Series:\n")
kpss_test(data['Non-Stationary'])
adf_test(data['Non-Stationary'])
平稳序列检验结果分析:
- KPSS 检验结果显示 p 值大于显著性水平 0.05,未能拒绝序列平稳的原假设
- Dickey-Fuller 检验的 p 值小于 0.05,拒绝序列存在单位根的原假设,证实序列平稳性
非平稳序列检验结果分析:
- KPSS 检验的 p 值小于 0.05,拒绝平稳性假设,表明序列非平稳
- Dickey-Fuller 检验的 p 值大于 0.05,未能拒绝单位根假设,同样证实序列非平稳性
总结
时间序列的平稳性检验是建模过程中的重要环节。KPSS 和 Dickey-Fuller 检验提供了两种互补的统计方法,可以帮助研究者准确评估序列的平稳性特征,并为后续的数据转换(如差分处理)提供依据。
- KPSS 检验适用于验证时间序列是否围绕确定性趋势呈现平稳特性
- Dickey-Fuller 检验主要用于检验序列是否存在单位根,尤其适用于 ARIMA 建模前的平稳性验证
由于这两种检验方法基于不同的统计假设,在实际应用中通常建议同时使用两种方法进行交叉验证,以获得更可靠的结论。
热门推荐
玩中学:创意游戏提升孩子情绪表达能力
均线数值应怎样准确求出?求出后如何在投资中加以应用?
肝脏替代治疗的希望:人工肝
西宁美食特色推荐:8道不可错过的地道美味
冯筱才:近代浙商的人文情怀与商业反哺
长期单身易患痛苦症,如何避免(单身)
如何用糖化血红蛋白正确评估血糖?牢记这 6 点
增值税中如何认定一般纳税人
退休后,不管是亲戚聚会,还是参加饭局,都要学会这三个定律
活性炭如何选购?活性炭选购超长科普——从种类到指标
山葵种植的适宜条件(探究山葵生长的环境要求)
梦中交流的未来:加州公司首创两人梦境沟通技术,迈向《盗梦空间》时代?
推荐5款懒人快手菜,5分钟就能搞定,好吃营养高,全家人都爱吃
Scratch语言环境安装与配置指南
什么是打字员,常见的打字员有好的发展前景吗
诸葛亮草船借箭,为何曹操浪费10万支箭,也不用一支“火箭”?
如何通过IP地址查询地理位置及运营商信息
简单易学的虾皮炒鸡蛋做法(健康美味五分钟上桌)
翼城:唐尧故地,晋国源头
想要让对比度更明显,可以从这6方面入手
Intel十二代酷睿处理器主板DDR4与DDR5内存差异及配置要点
报告 | 关注人工智能鸿沟:女性劳动者最易受AI自动化导致的工作岗位流失影响
全面解析茶叶分级标准:从初级到特级的全方位解读
北卡罗来纳州立大学地理信息系统专业怎么申请
脖子里长个硬疙瘩怎么回事
《大龄剩女为何不能要》:探讨现代社会对女性的误解与偏见
ArcGIS Pro土壤侵蚀模型USLE计算全过程
精密加工技术在模具设计中的应用
视频文件损坏无法播放?这里有几种修复方法!
春运没买到直达火车票咋办?站长教你如何分段购票、中转换乘