问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

因果推荐:利用推荐中流行度偏差的因果干预

创作时间:
作者:
@小白创作中心

因果推荐:利用推荐中流行度偏差的因果干预

引用
CSDN
1.
https://blog.csdn.net/cyzz523/article/details/140827119

推荐系统中的人气偏差问题一直困扰着研究人员。一方面,盲目消除所有人气偏差可能导致有用信息的丢失;另一方面,过度依赖人气偏差又会导致推荐结果的片面性。针对这一问题,来自北京大学的研究团队提出了PDA(Popularity-bias Deconfounding and Adjusting)框架,通过因果推断技术,在消除负面人气偏差的同时,合理利用正面人气偏差,从而提高推荐系统的准确性和公平性。

1. 动机

推荐系统通常面临着人气偏差的问题:从数据角度看,不同物品的交互频率通常呈现出不均匀的长尾分布;从方法角度看,协同过滤方法容易放大这种偏差,导致热门物品在推荐中占据主导地位。然而,并非所有的人气偏差都是负面的。有些物品因其内在质量更高或代表当前潮流而更受欢迎,盲目地消除这些偏差可能会导致丢失数据中的有用信息,降低推荐准确性和用户满意度。因此,本研究探讨了一个新的问题:如何有效地利用人气偏差来提高推荐准确性。

2. 贡献

  1. 提出了一个名为PDA(Popularity-bias Deconfounding and Adjusting)的新框架。PDA框架通过在模型训练阶段去除混淆的人气偏差,同时在推断阶段利用因果干预技术,将期望的人气偏差引入推荐分数中。在消除人气偏差负面影响的同时,合理利用正面的人气偏差,提升推荐系统的准确性。

  2. 在推荐系统中应用因果图,分析了物品人气在推荐生成过程中的作用。物品人气作为暴露物品和用户观测交互之间的混淆因素,放大了偏差的负面影响。通过因果图分析,揭示了推荐系统中的人气偏差如何影响推荐结果的机制。

3. 因果图

如图所示,节点𝑍表示项目受欢迎程度,该节点有两条边分别指向𝐼和C.首先,𝑍→C表示物品的受欢迎程度直接影响交互概率,因为许多用户有从众心理(即从众心理),倾向于跟随大多数人去消费受欢迎的物品。其次,𝑍→𝐼意味着物品的受欢迎程度会影响物品是否被曝光。因此,物品人气作为一个混淆因素,可能导致用户偏好和物品推荐之间产生虚假的关联。如果不去除物品人气的混淆效应,推荐系统容易将物品的高人气错误地解释为用户的高偏好,从而导致推荐结果的偏差。

4. 模型

4.1 问题定义:物品流行度计算

物品𝑖在阶段𝑡的局部人气𝑚𝑡𝑖,𝑚𝑡𝑖为该物品在该阶段的观察到的交互次数与所有物品交互次数之和的比值。

物品流行度漂移(DP) :物品人气是动态的,并随时间变化,这意味着人气偏差的影响也可能是动态的,因此DP计算如下;

使用Jensen-Shannon散度(JSD)来衡量两个阶段之间的相似性

图左显示了两个连续阶段的DP值,即𝐷(𝑡,𝑡+1),其中𝑡在三个真实数据集上从1迭代到9。这三个数据集都明显存在人气漂移,并且不同的数据集表现出不同程度的人气漂移。图右显示了第一阶段和当前阶段的DP值,即𝐷(1,𝑡),它衡量了累积的人气漂移。可以看到一个明显的上升趋势,表明时间间隔越长,数据显示的人气漂移越大。这些结果表明,流行偏见及其影响也随着时间的推移而变化。未来阶段的人气偏向与过去阶段不同。如果我们将模型泛化的目标设定为追求下一阶段数据D𝑇+1 2的高精度,那么一个可行的方法是预测流行趋势并将其注入到推荐中。

4.2 去混淆训练(如何获得一个不受路径 Z→I 影响的模型)--训练阶段

虽然理论上可以通过随机曝光物品来消除人气对推荐结果的影响,但在实际操作中,这种方法的可行性和有效性较低。因此通过执行 do(I)操作,可以强制消除 Z的影响。给定因果图 G,执行 do(I) 后得到的干预因果图 G′。然后,通过 do-calculus 可以将模型的预测公式从传统的 P(C∣U,I) 转变为去混淆后的 P(C∣do(U,I)):

•(1)是由于后门准则作为唯一的后门路径𝐼←𝑍→𝐺已被𝑑𝑜(𝑈,𝐼)阻断;
•(2)是因为贝叶斯定理;
•(3)因为𝑈和𝐼与𝐺'中的𝑍是独立的;
•(4)𝑃(𝐶|𝑈,𝐼,𝑍)=𝑃𝐺”(𝐶|𝑈,𝐼,𝑍)是因为因果机制{𝑈、𝐼𝑍}→𝐶时没有改变切断𝑍→𝐼,𝑃(𝑍)=𝑃𝐺”(𝑍)自𝑍之前有相同的两个图形。接下来考虑如何从数据中估计出(𝐼,𝑈);需要首先估计𝑃(𝐶|𝑈,𝐼,𝑍),然后估计

4.2.1估计条件概率函数𝑃(𝐶|𝑈,𝐼,𝑍)

估计给定用户 U=u、物品 I=i和当前阶段物品人气 Z=mti的情况下,用户与该物品交互的可能性 P(C=1∣u,i,mti):

𝑗为𝑢的负样本,φ(·)为激活函数,并使用了𝐿2正则化,接下来考虑如何参数化𝑃Θ(𝑐= 1|𝑢,,𝑚𝑡),可以使用神经网络。但主要考虑是将用户-物品匹配与物品人气解耦,这有两个好处:

  1. 解耦使得该框架能够扩展到任何关注用户-物品匹配的协同过滤模型。
  2. 解耦使得在推断阶段能够快速调整人气偏差,因为不需要重新评估整个模型。因此条件概率函数的设计为:

fΘ (u,i) 表示任何用户-物品匹配模型,文中选择了简单的矩阵分解。超参数 γ用于平滑物品人气,可以控制从众效应的强度,ELU为用户项匹配组件。

4.2.2 估计干预概率

估计干预概率 𝑃 (𝐶|𝑑𝑜 (𝑈 , 𝐼))。因为 Z 的空间很大,为每个预测评估在其空间上求和是不合适的。因此进行了化简,以消除这个求和步骤:

E(Zγ) 表示 Zγ的期望。由于一个变量的期望是一个常数,且 P(C∣do(U,I))用于为用户排序物品,因此这个期望值的存在并不会改变物品的排序。将历史交互数据与𝑃Θ(𝑐= 1|𝑢,,𝑚𝑡),拟合,并使用用户项匹配组件ELU’(𝑓Θ(𝑢,))进行去基础排序,将这种方法命名为流行偏差反建立(PD)。

4.3 调整推理中的人气偏差--推理阶段

通过去混淆训练,模型能够消除人气偏差的负面影响。然而,仅仅消除负面影响还不够,还需要在推断阶段更好地利用人气偏差,以提高推荐性能。通过干预技术,可以在推理阶段注入期望的人气偏差,从而实现这一目标。假设目标是希望引入一个特定的人气偏差 z,我们可以通过对模型进行干预来实现这一目标:

表示物品 i的流行度

。在因果图中,由于不存在从 Z到 C 的后门路径,这种干预概率可以直接等同于条件概率。采用了一种简单的时间序列预测方法来设置

:T代表上一阶段,

为预测未来时控制流行漂移强度的超参数。

训练阶段的核心是通过去混淆训练消除负面的人气偏差影响。具体来说,这个阶段通过优化公式

来完成,即通过因果推断和do-calculus消除物品人气对用户偏好的负面影响。该训练过程旨在确保模型能够更准确地反映用户的真实兴趣,而不是过度依赖于物品的受欢迎程度。

推理阶段:模型在执行预测时,可以根据需要调整人气偏差。也就是说,在给定用户和物品的情况下,模型能够通过引入期望的正面人气偏差来调节推荐分数,以提高推荐系统的性能。下图是模型的框架图,

蓝色是训练阶段,红色是推理阶段 。PD 是指去混淆人气偏差的过程,主要关注消除人气偏差对模型训练的负面影响。在PD中,模型通过去混淆的训练方法,剔除物品人气对用户行为的虚假影响,以确保模型能够真实反映用户的兴趣。

PDA 不仅包括去混淆训练,还进一步结合了推理阶段的调整过程。在PDA中,模型在消除负面人气偏差影响的基础上,还可以在推理阶段通过调节参数 γ和注入的目标人气偏差值

,灵活调整推荐结果的排序。这种方法不仅能提高推荐的准确性,还能保持推荐结果的多样性和公平性。

上述为模型的算法,结合了去混淆人气偏差(PD)和人气偏差调整(PDA)的流程,主要用于训练和推断阶段。

输入:

  • 数据集 D:数据集包含了用户 u、物品 i以及物品在阶段 t的人气值 mti。
  • 超参数 γ:用于控制人气平滑的超参数,影响从众效应的强度。

步骤1:随机初始化模型参数 Θ,用于学习用户-物品匹配的模型。

步骤 2:训练阶段。优化目标函数:优化损失函数来更新模型参数。通过对比用户对正样本 i和负样本 j的偏好差异来进行模型的训练

步骤 3:推断阶段,调整人气偏差

步骤 4:模型选择,在 PDA 框架中,模型选择基于调整后的推荐结果。这意味着模型训练的终止条件不仅依赖于传统的损失函数,还依赖于在人气偏差调整后模型在验证集上的表现。

5 总结

这篇论文提出了去混淆和调整人气偏差(Popularity-bias Deconfounding and Adjusting, PDA)的框架,通过因果推断技术来解决推荐系统中的人气偏差问题。与传统方法相比,该框架利用因果图和do-calculus(do演算)技术,先消除推荐系统中人气偏差的负面影响,再在推断阶段调整并利用人气偏差,从而提高推荐系统的准确性和公平性。与其他论文不同,PDA不仅仅通过去混淆来消除偏差,而是将因果推断和偏差调整结合在一起,使得推荐系统能够在推断阶段更灵活地利用期望的人气偏差。

因果图设计:构建了因果图。揭示了物品人气作为混淆因素,如何通过影响物品的曝光机会和用户的交互行为来放大推荐系统中的偏差。

去混淆训练(PD):在训练阶段,PDA框架使用do-calculus来消除物品人气对用户偏好的负面影响。通过优化一个因果推断模型,PDA确保在训练过程中去除人气偏差,通过计算干预后用户对物品的偏好概率,通过更新模型参数,使得模型能够在没有人气偏差影响的情况下捕捉用户的真实偏好。从而消除混杂因素影响,使模型能够更准确地反映用户的真实兴趣。

偏差调整(PDA):在推断阶段,PDA框架不仅考虑用户和物品之间的匹配,还通过控制参数 γ来调整人气偏差的强度以及目标人气偏差值,以利用人气偏差来提高推荐性能。

因果图与调整策略的结合:因果图展示了物品人气作为混淆因素的影响,因此通过去混淆训练和偏差调整策略,PDA框架在消除人气偏差的负面影响的同时,还能够在推断阶段通过引入正面人气偏差来优化推荐结果。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号