问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

文献阅读:使用深度学习解决具有不可观测特征的报童问题

创作时间:
作者:
@小白创作中心

文献阅读:使用深度学习解决具有不可观测特征的报童问题

引用
CSDN
1.
https://blog.csdn.net/JamesHuaZai/article/details/137186899

在学习笔记8中介绍了机器学习结合运筹学的一阶段模型,该模型考虑了特征信息对最优决策的影响,所有的特征都是可观测到的。下面这篇文章则考虑了具有不可观测特征的报童问题。

不可观测特征的概念

什么叫不可观测特征?举个例子,我有三个箱子,每个箱子里都有红球和白球,我现在手里有三个红球,问这三个红球是哪个箱子里的球?

我手里能看到的球就叫观测序列【红,红,红】,对应需求数据序列,即我们可以观测到的报纸的需求数据序列;

看不到的箱子的序列就叫状态序列【箱子x,箱子x,箱子x】,对应不可观测特征的序列,先不管他是啥,我只需要知道有这么一个玩意会影响需求,把它当成一列新的特征即可。

文章的核心方法

这篇文章的核心就是在一阶段模型的基础上增加了这一列不可观测特征,也就是状态序列。那么问题来了,怎么得到状态序列呢?有这么个东西叫隐马尔可夫模型(Hidden Markov Model,HMM),它有一个作用就是根据观测序列求状态序列,观测序列我们有了,不是吗?

关于更多HMM的内容请参考下面这篇文章:

一文带你了解隐马尔可夫模型https://zhuanlan.zhihu.com/p/547259609

下图是这篇文章的模型网络图,Emission Network用于接收特征数据作为输入,并输出每个状态的观测概率,这些概率随后用于HMM网络的状态估计;HMM将估计好的不可观测状态序列再输入到Newsvendor Network中,就相当于在原来一阶段模型的基础上增加了一列额外的特征,其余不变。

实验结果与对比

那么这样做效果如何呢?文章用了5个对比方法

一、EDD,等同于学习笔记8中的SAA方法不考虑特征

二、obBW,等同于学习笔记8中的两阶段模型加了一列不可观测特征

三、PfLR,等同于学习笔记8中的两阶段模型没有加不可观测特征

四、LML,等同于学习笔记8中一阶段模型没有加不可观测特征,用的线性预测模型

五、DNN,等同于学习笔记8中一阶段模型没有加不可观测特征,用的非线性预测模型深度神经网络,能够更好的拟合非线性关系

将上述5个方法和HMMNV相对于真实模型的偏差百分比可视化如下所示,由图可见本文的HMMNV取得了和真实模型差异最小的表现,进而说明了考虑不可观测特征的重要性。后面作者还进行了两两p值检验,不同方法在不同超参数下的性能对比以及真实数据的实验。

总结

总的来说,文章考虑了不可观测特征在一阶段模型上的影响,提出了一种新颖的思路,通过结合隐马尔可夫模型来估计不可观测特征,从而改进了传统的报童问题模型。这种方法不仅在理论上具有创新性,在实际应用中也展现出了更好的性能。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号