PyTorch 深度学习实战:时间序列预测与 LSTM 模型
创作时间:
作者:
@小白创作中心
PyTorch 深度学习实战:时间序列预测与 LSTM 模型
引用
CSDN
1.
https://blog.csdn.net/m0_60414444/article/details/146160709
时间序列预测是机器学习领域的一个重要应用方向,广泛应用于股票价格预测、气象数据预测等领域。长短期记忆网络(LSTM)是一种特殊的循环神经网络(RNN),通过门控机制解决传统 RNN 的梯度消失问题,擅长捕捉长期依赖关系。本文将通过一个正弦波数据预测的例子,详细介绍如何使用PyTorch实现LSTM模型进行时间序列预测。
一、时间序列预测基础
时间序列是按时间顺序排列的数据点序列,广泛存在于股票价格、气象数据、传感器记录等领域。预测未来时间步的值是时间序列分析的核心任务之一。
LSTM 模型简介
长短期记忆网络(LSTM)是一种特殊的循环神经网络(RNN),通过门控机制解决传统 RNN 的梯度消失问题,擅长捕捉长期依赖关系。其核心结构包括:
- 遗忘门:决定丢弃哪些信息。
- 输入门:更新细胞状态。
- 输出门:决定输出的隐藏状态。
二、时间序列预测实战
我们将使用合成的正弦波数据,训练一个 LSTM 模型预测未来值。
1. 实现步骤
- 生成并预处理数据。
- 定义 LSTM 模型。
- 训练模型。
- 预测并可视化结果。
2. 代码实现
import torch
import torch.nn as nn
import numpy as np
import matplotlib.pyplot as plt
# 生成正弦波数据
def generate_sin_data(seq_length=1000):
x = np.linspace(0, 50, seq_length)
y = np.sin(x) * 0.5 + 0.5 # 归一化到 [0,1]
return y
# 数据预处理(滑动窗口)
def create_dataset(data, window_size=20):
X, Y = [], []
for i in range(len(data)-window_size):
X.append(data[i:i+window_size])
Y.append(data[i+window_size])
return np.array(X), np.array(Y)
# 参数设置
SEQ_LENGTH = 1000
WINDOW_SIZE = 20
BATCH_SIZE = 32
EPOCHS = 100
# 生成数据
data = generate_sin_data(SEQ_LENGTH)
X, Y = create_dataset(data, WINDOW_SIZE)
# 划分训练集和测试集
split = int(0.8 * len(X))
X_train, X_test = X[:split], X[split:]
Y_train, Y_test = Y[:split], Y[split:]
# 转换为PyTorch张量
X_train = torch.FloatTensor(X_train).unsqueeze(-1) # [样本数, 窗口大小, 特征数]
Y_train = torch.FloatTensor(Y_train)
X_test = torch.FloatTensor(X_test).unsqueeze(-1)
Y_test = torch.FloatTensor(Y_test)
# 定义LSTM模型
class LSTMPredictor(nn.Module):
def __init__(self, input_size=1, hidden_size=50, output_size=1):
super().__init__()
self.lstm = nn.LSTM(input_size, hidden_size, batch_first=True)
self.linear = nn.Linear(hidden_size, output_size)
def forward(self, x):
x, _ = self.lstm(x) # 输出形状: [batch, seq_len, hidden_size]
x = x[:, -1, :] # 取最后一个时间步的输出
return self.linear(x)
# 初始化模型、损失函数和优化器
model = LSTMPredictor()
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)
# 训练模型
train_losses = []
for epoch in range(EPOCHS):
model.train()
optimizer.zero_grad()
outputs = model(X_train)
loss = criterion(outputs.squeeze(), Y_train)
loss.backward()
optimizer.step()
train_losses.append(loss.item())
if (epoch+1) % 10 == 0:
print(f'Epoch [{epoch+1}/{EPOCHS}], Loss: {loss.item():.4f}')
# 预测测试集
model.eval()
with torch.no_grad():
test_pred = model(X_test).squeeze().numpy()
# 可视化结果
plt.figure(figsize=(12, 6))
plt.subplot(1,2,1)
plt.plot(train_losses)
plt.title("Training Loss Curve")
plt.xlabel("Epoch")
plt.ylabel("MSE Loss")
plt.subplot(1,2,2)
plt.plot(Y_test.numpy(), label="True Value")
plt.plot(test_pred, label="Prediction")
plt.title("Test Prediction")
plt.legend()
plt.show()
三、代码解析
- 数据生成:
- 使用
generate_sin_data生成包含 1000 个点的正弦波。 - 通过
create_dataset创建滑动窗口样本(用前 20 个点预测第 21 个点)。
- 模型结构:
LSTMPredictor包含一个 LSTM 层和一个全连接层。- LSTM 的
hidden_size设置为 50,可根据数据复杂度调整。
- 训练过程:
- 使用均方误差(MSE)作为损失函数。
- Adam 优化器进行参数更新。
- 训练 100 个 epoch,每 10 个 epoch 打印损失值。
- 结果可视化:
- 左图显示训练损失下降曲线。
- 右图对比测试集的真实值和预测值。
四、运行结果
运行代码后,你将看到:
- 训练损失从约 0.1 逐渐下降至 0.001 以下。
- 测试集的预测曲线(橙色)与真实曲线(蓝色)基本重合。
五、改进建议
- 增加特征维度:除了历史值,可加入温度、湿度等多维特征。
- 使用更复杂模型:如堆叠多层 LSTM 或结合 CNN。
- 调整超参数:尝试不同的
hidden_size或WINDOW_SIZE。 - 使用真实数据:替换为股票价格或电力负荷数据。
六、总结
本文介绍了时间序列预测的基本概念,并使用 PyTorch 实现了一个简单的 LSTM 预测模型。通过这个例子,我们学习了如何处理序列数据、构建 LSTM 模型以及进行训练和预测。
在下一篇文章中,我们将探讨生成对抗网络(GAN)在图像生成中的应用。敬请期待!
代码实例说明:
- 可直接在 Python 3.7+ 环境中运行,依赖库:
torch,numpy,matplotlib。 - GPU 加速:修改
model = model.to('cuda')并转移数据到 GPU。 - 调整
WINDOW_SIZE可改变历史数据长度,hidden_size影响模型容量。
希望这篇文章能帮助你入门时间序列预测!如有问题,欢迎在评论区讨论。
热门推荐
大学生必看!新学习期平衡课业与竞赛秘籍
普通人怎么可以出国打工?
企业工资困境:资金链断裂下的员工 "薪愁"与企业 "寒冬"
秦桧害死岳飞13年后得重病,高宗探视病情,秦桧一句话不说只流泪
在乔丹之前,贾巴尔是不是NBA历史第一人
古人的审美竟与我们相似,揭秘魏晋时期,人们为何喜爱“小鲜肉”
胸痛就医指南:读懂心梗、主动脉夹层、肺栓塞的黄金救治时间
维生素C与健康:误区、益处及安全摄入指南
买基金什么叫套牢?基金套牢的情况如何避免?
硅胶冰格怎么去除异味,本文来告诉你[生活技巧]
下腹疼痛需要做哪些检查
DouZero斗地主AI深度解析,以及RLCard工具包介绍
【英语时态详解】一般现在时、一般过去时与一般将来时的区别与用法
Markdown中图片处理完全指南:从基础到进阶
炸板率的计算方法是什么?这种计算方法的准确性如何?
颌下腺结节是什么原因引起的怎么治疗
电视机功率多少w
RPG游戏深度解析:沉浸式角色扮演与多元故事的精彩碰撞
《哪吒2》登顶世界动画榜,期待激发国漫产业“鲶鱼效应”
2.8万条数据揭秘连续涨停股: 绩差小盘特征鲜明 三大风险需警惕
论文查重是否能识别PDF与Word格式的差异?
测试方法之——正交实验法,一文搞懂,建议收藏
大型语言模型:2024年回顾与2025年趋势
如何委婉提加薪
柳高开学第一课,安全知识轻松“拿捏”!
国外网站为何也遭遇封锁,探究跨境互联网审查的原因
肠胃不好的人,能不能吃粽子?一次讲清楚,教你正确养胃
小猫眼睛有脓性分泌物怎么办?正确使用眼药水的指南
网络电话通信:突破传统电话局限实现便捷高效沟通
怎样分析股票的 RSI 与成交量的关系影响对市场情绪判断的重要性?