告别嘈杂社交数据,让社交推荐更精准!
告别嘈杂社交数据,让社交推荐更精准!
在信息过载的今天,推荐系统已成为我们探索世界的"智能指南针"。其中,社交推荐系统通过挖掘用户间的社交关系[1],为"人以群分"的古老智慧注入了算法活力。然而,当前社交推荐算法研究主要基于对用户理想化的“同质性假设”[2]——拥有好友关系的用户在推荐域必然拥有相似偏好。但现实往往更复杂:你可能与同事是好友却钟爱不同类型的电影,而你在读书社区结识的书友与你在音乐品味上大相径庭。这种社交关系与兴趣偏好的错位,就像在信号传输中引入了"噪声",反而会干扰以同质性假设为基础的推荐系统的判断。图1绘制了用户社交关系强度与用户推荐域行为相似度关联图,显示了这种“弱相关但含噪声”的复杂关系。
图1 社交关系强度与用户推荐域行为相似度的相关性(注:此图仅示意一阶、线性相关性)
近些年,尽管学界已越来越多地关注到社交噪声现象,但现有研究存在两个关键缺失:一是对噪声成因的系统性归类不足,二是缺乏针对性的去噪机制设计,导致社交信息去噪效果欠佳。针对上述挑战,电子科技大学胡铮博士,任福继院士,东京大学的中川聪教授等人提出了一种分级的社交信息去噪框架Hierarchical Denoising for Robust Social Recommendation(HDSR)。
图2 模型框架示意图,其中蓝色部分为“去噪”模块
图3 用户嵌入可视化
如图2所示,HDSR从社交噪声的生成机理出发构建双重视角去噪体系:
域内视角(Intra-domain Perspective):解构社交关系的多面性
·产生原因:用户社交关系的“多面性”[3] ——人们建立联系的动机复杂多样(如工作关系、兴趣社群、亲缘纽带等)
·解决方案:提出基于用户兴趣和社会心理学的社交网络边权重计算和动态剪裁方法,为每段友谊打上"兴趣契合度标签"。
域间视角(Inter-domain Perspective):抵御知识迁移的副作用
·产生原因:跨领域知识迁移过程中的信息纠缠(如将微博关系迁移到电商推荐)
·解决方案:设计用户兴趣引导的跨域去噪门控机制,为信息迁移安装"智能筛网"。
研究团队在三个真实世界数据集(Douban, Epinions, Yelp)上验证了他们所提出方法的有效性:
优秀的推荐表现:我们的方法有优异的社交推荐表现,尤其是对“冷启动”用户,这种优势更明显
抗干扰能力突出:在人工向社交网络加入噪声的实验中,我们的方法展示出了良好的鲁棒性
用户表征稳定:可视化分析与定量研究显示(图3与表1),去噪后的用户嵌入(用户特征向量)在噪声环境下仍能保持清晰稳定的结构
这项研究揭示,社交推荐的核心不在于关系数量的堆砌,而在于精准捕捉关系中的有效信息。HDSR通过(1)社交关系多维度解析(2)基于门控机制的跨域知识迁移,实现了更鲁棒的社交推荐算法。
论文信息:Hu Z, Nakagawa S, Zhuang Y, et al. Hierarchical Denoising for Robust Social Recommendation[J]. IEEE Transactions on Knowledge and Data Engineering, 2024.
原文链接:https://ieeexplore.ieee.org/abstract/document/10771708
论文代码:https://github.com/laowangzi/HDSR
参考文献
[1] Wei D, Zhou T, Cimini G, et al. Effective mechanism for social recommendation of news[J]. Physica A: Statistical Mechanics and its Applications, 2011, 390(11): 2117-2126.
[2] McPherson M, Smith-Lovin L, Cook J M. Birds of a feather: Homophily in social networks[J]. Annual review of sociology, 2001, 27(1): 415-444.
[3] Tang J, Gao H, Liu H. mTrust: Discerning multi-faceted trust in a connected world[C]//Proceedings of the fifth ACM international conference on web search and data mining. 2012: 93-102.