聊聊基于 LSTM 的多特征序列预测-SHAP可视化!
创作时间:
作者:
@小白创作中心
聊聊基于 LSTM 的多特征序列预测-SHAP可视化!
引用
51CTO
1.
https://www.51cto.com/aigc/2862.html
前言
本文基于前期介绍的电力变压器,介绍一种基于 LSTM 预测模型的 SHAP 可视化分析教程。
数据集是使用.csv形式进行存储的,包括了除时间列外 “HUFL”, “HULL”, “MUFL”, “MULL”, “LUFL”, “LULL” 和 “OT”7个特征。
1 多特征变量数据集制作与预处理
1.1 导入数据集
取油温数据 OT 为目标预测值!
1.2 数据集制作
按照 8:2 划分训练集,测试集,滑动窗口设置为12
2 基于Pytorch的 LSTM 预测模型
2.1 定义 LSTM 预测模型
2.2 设置参数,训练模型
注意调整参数:
- 可以修改LSTM层数和每层神经元个数;
- 增加更多的 epoch (注意防止过拟合)
- 可以改变滑动窗口长度(设置合适的窗口长度)
3 模型评估与可视化
3.1 结果可视化
3.2 模型评估
4 SHAP 可视化分析
SHAP 特征重要性-Summary Plot
将 SHAP 值矩阵传递给条形图函数会创建一个全局特征重要性图,其中每个特征的全局重要性被视为该特征在所有给定样本中的平均绝对值。
上面使用Summary Plot方法并设置参数plot_type="bar"绘制典型的特征重要性条形图,而他默认绘制Summary_plot图,他是结合了特征重要性和特征效果,取代了条形图。
Summary_plot 为每一个样本绘制其每个特征的Shapley value,它说明哪些特征最重要,以及它们对数据集的影响范围。
y 轴上的位置由特征确定,x 轴上的位置由每 Shapley value 确定。颜色表示特征值(红色高,蓝色低),颜色使我们能够匹配特征值的变化如何影响风险的变化。重叠点在 y 轴方向抖动,因此我们可以了解每个特征的 Shapley value分布,并且这些特征是根据它们的重要性排序的。
热门推荐
“健身指导站”为全民健康添动力
金方廷读《激情的陷阱》|当优绩不等于优秀,打工人为何仍怀激情
军训时比晒黑更可怕的,是晒伤
表面活性剂及其在电镀中的应用
拐弯抹角!搞什么名堂?这些词都咋来的?
布满针头的微针在脸上滚一滚就能美容?专家:属于医疗行为,不建议自行操作
中老年人养生饮食指南 四季养生菜谱大全
2024组装一台能跑AI大模型的电脑
以人为镜反思自我
燃气表换电池后无反应怎么办?这些检查步骤请收好
无人机:地缘政治领域的新前沿
西南科技大学:西部高校的崛起之路
深入财务数据分析:揭秘公司报表中的投资线索
酷睿Ultra 200S能用14代酷睿的散热器吗?LGA 1700都行
三角纤维软骨复合体损伤!从解剖到治疗
DX11和DX12有什么区别
亲子鉴定需求上升,背后折射的社会伦理问题引发关注
梦见在空中飞翔是什么意思
鼻涕的奥秘:不同颜色,不同“警报”
“蛇钞”溢价200%背后:三大原因刺激二手行情走高
全国各地区工资水平差异明显,哪个地区工资最高?
“哪吒线路”爆火!这些景点已成热门打卡地
上古时期十大人物:从盘古到燧人
自动车床加工:零件制造的明日之星
邢台矫正牙需要注意什么
冲绳琉球王国三大特色|传统手工艺,钟乳石奇景玉泉洞、特色毒蛇秀与毒蛇博物馆
2024年湖北省985/211高校美术类录取分数线!
生普与熟普:体质偏寒者的选择之道
选择合适的塑料包装薄膜
铜仁至贵阳各类交通工具票价一览及实时查询指南