聊聊基于 LSTM 的多特征序列预测-SHAP可视化!
创作时间:
作者:
@小白创作中心
聊聊基于 LSTM 的多特征序列预测-SHAP可视化!
引用
51CTO
1.
https://www.51cto.com/aigc/2862.html
前言
本文基于前期介绍的电力变压器,介绍一种基于 LSTM 预测模型的 SHAP 可视化分析教程。
数据集是使用.csv形式进行存储的,包括了除时间列外 “HUFL”, “HULL”, “MUFL”, “MULL”, “LUFL”, “LULL” 和 “OT”7个特征。
1 多特征变量数据集制作与预处理
1.1 导入数据集
取油温数据 OT 为目标预测值!
1.2 数据集制作
按照 8:2 划分训练集,测试集,滑动窗口设置为12
2 基于Pytorch的 LSTM 预测模型
2.1 定义 LSTM 预测模型
2.2 设置参数,训练模型
注意调整参数:
- 可以修改LSTM层数和每层神经元个数;
- 增加更多的 epoch (注意防止过拟合)
- 可以改变滑动窗口长度(设置合适的窗口长度)
3 模型评估与可视化
3.1 结果可视化
3.2 模型评估
4 SHAP 可视化分析
SHAP 特征重要性-Summary Plot
将 SHAP 值矩阵传递给条形图函数会创建一个全局特征重要性图,其中每个特征的全局重要性被视为该特征在所有给定样本中的平均绝对值。
上面使用Summary Plot方法并设置参数plot_type="bar"绘制典型的特征重要性条形图,而他默认绘制Summary_plot图,他是结合了特征重要性和特征效果,取代了条形图。
Summary_plot 为每一个样本绘制其每个特征的Shapley value,它说明哪些特征最重要,以及它们对数据集的影响范围。
y 轴上的位置由特征确定,x 轴上的位置由每 Shapley value 确定。颜色表示特征值(红色高,蓝色低),颜色使我们能够匹配特征值的变化如何影响风险的变化。重叠点在 y 轴方向抖动,因此我们可以了解每个特征的 Shapley value分布,并且这些特征是根据它们的重要性排序的。
热门推荐
分布式数据库如何选择
产科小孧科普:如何应对宝宝夜醒、哭闹等睡眠问题?
查询公司股权:了解公司所有权结构
半导体的晶圆与流片是什么意思?
南通属于哪个省份哪个区?了解南通的地理位置
什么是“环崖丹崖”?
创业板新股申购规则详解:一签是多少股?
技术干货:三大必涨形态之欧奈尔杯柄形态
梅西的职业生涯惨案那么多,为什么大部分球迷甚至FIFA官方依然认定梅西是球王
足坛历史球员点球进球数排名!梅西高居第三 但命中率仅为78%
龙吸水:苍穹与海不相容,化身涡旋将相融
如何理解石雕弥勒佛的“大肚能容,容天下难容之事”这一寓意?
普通感冒的临床表现及应对方法
欧洲贵族养子爵位继承的历史考察
英语句子类型大揭秘:从简单句到复合句,让你的表达更上一层楼!
信噪比(SNR)的定义,如何计算信噪比
瑜伽腹式呼吸的好处和功效
怎样缓解头痛
休息不好头疼怎么办?专家给出五大缓解方法
骨肿瘤的主要临床表现
越吃越瘦!这5种食物竟是内脏脂肪的克星
质量管理条例的监督机构有哪些?
宝可梦检查和特殊状态
揭秘盐足浴:自然疗法的放松与健康益处
北航VS哈工大:顶尖工科院校全方位对比分析
可转换债券的组成部分
学术论文“起·承·转·合”的逻辑构成与运用
猫疱疹病毒的症状及治疗方案全解析
猫鼻支是什么
构建无障碍的交互体验:为所有用户提供平等访问机会的最佳实践