分享自:

基于知识图谱的用户偏好传播推荐系统研究

期刊:ACMDOI:10.1145/3269206.3271739

为了更好地帮助中国学术社区理解本文对推荐系统的研究贡献,我们为您提供一篇基于Ripplenet研究论文的综合学术报告:


基于知识图谱的用户偏好传播机制——Ripplenet研究综述

作者及出版信息:
本文由Hongwei Wang等研究人员联合完成,作者所属机构包括上海交通大学、Microsoft Research Asia、美团点评集团以及香港理工大学等。论文发表在2018年10月22-26日于意大利都灵召开的第27届ACM国际信息与知识管理会议(CIKM ’18)上,并附有DOI链接(https://doi.org/10.11453269206.3271739)。


背景与研究目标

推荐系统的问题与机遇

随着互联网内容与服务数量的爆炸性增长(如新闻、书籍、电影等),个性化推荐系统(Recommender Systems, RS)的作用愈加重要。协同过滤(Collaborative Filtering, CF)作为推荐策略的核心,利用用户的历史交互行为探索潜在偏好,取得了良好效果。但CF面临以下诸多挑战: 1. 数据稀疏性问题:用户-物品交互矩阵通常极为稀疏。 2. 冷启动问题:对于新用户或新物品,历史交互信息有限,推荐效果受限。

解决这些问题的一个方向是引入辅助信息(Side Information),如社交网络、物品属性及上下文语境等。然而,知识图谱(Knowledge Graph, KG)因其能描述物品间丰富且多样的连接关系,已成为研究热点。学术界和行业内涌现出了诸多高质量知识图谱(如DBpedia、Google Knowledge Graph和Microsoft Satori),广泛应用于多种任务(如知识图谱补全、问答系统等)。

本研究的重要性与核心目标

已有的KG感知推荐方法分为两类: 1. 嵌入式方法:通过知识图谱嵌入(Knowledge Graph Embedding, KGE)获取实体嵌入,例如CKE模型。 2. 基于路径的方法:提取KG中的元路径或元图特征建立用户与物品间联系,例如PER和Meta-Graph推荐方法。

然而,这两类方法各有不足:嵌入方法难以直观地表征物品间的关系,路径方法则过于依赖手工设计的元路径。为此,本文提出Ripplenet框架,结合两种方法的优势,通过用户偏好的递归传播发现其在知识图谱中的分层潜在兴趣,从而提高推荐效果。


研究方法与实现细节

Ripplenet框架概述

Ripplenet是一种端到端框架,设计用于点击率预测(Click-Through Rate, CTR)。其核心机制被称为偏好传播(Preference Propagation),以用户历史兴趣为种子集,通过KG中的实体-关系-实体链路递归扩展用户兴趣,模拟如涟漪(Ripple)传播般的递层用户偏好生成机制。此框架的主要流程包括: 1. 输入:用户与候选物品对。 2. 偏好传播:激活用户历史点击物品在KG中的相关实体(称为Ripple Sets),并逐层迭代传播初始兴趣。 3. 预测生成:通过多层偏好响应生成的用户嵌入,与候选物品的嵌入结合,计算CTR点击概率。

核心模块及算法

  1. Ripple Set生成:KG中的Ripple Set定义为用户点击历史物品通过某k-Hop链路连接的实体集合。较近的Hop通常带来更高的相关性,远距离Hop可能带噪声。

  2. 偏好传播计算:针对Ripple Set中每个三元组(头实体、关系、尾实体),通过Softmax计算候选物品与头实体间的相关性权重,并以此加权尾实体嵌入来生成用户的k次响应。

  3. 用户嵌入综合:多级响应(如1-Hop、2-Hop等)通过加权叠加形成最终用户嵌入。

  4. 优化目标:Ripplenet的训练旨在优化CTR预测,融合KG的结构约束与正则化,对用户、物品及关系嵌入进行学习。在模型优化中,负采样(Negative Sampling)进一步增强了训练效率。


实验与结果分析

研究人员在电影(MovieLens-1M)、书籍(Book-Crossing)、新闻(Bing-News)三个真实场景中验证Ripplenet的性能,具体结果如下:

实验设置与比较基准

  • 数据源
    三个数据集均构建于Microsoft Satori KG之上。

| 数据集 | 用户数 | 物品数 | 交互数 | KG triples(1-Hop至4-Hop) | |———|——–|———|———|—————————-| | MovieLens | 6,036 | 2,445 | 753,772 | 20,782178,049/318,266等 |

  • 对比模型:包括CKE、SHINE、DKN、PER等基于KG的经典推荐模型,以及通用推荐工具(LibFM, Wide&Deep)。

  • 评价指标:AUC(曲线下面积)、Accuracy(准确率)、Precision@K等。

实验结果与观察

  1. 总体比较

    • Ripplenet在多个数据集的AUC上领先其他基准模型,其性能超越CKE等模型2%-40%不等。
    • 在Top-K推荐任务中,Ripplenet在精度(Precision@K)和召回率(Recall@K)上表现优异。
  2. 参数优化

    • Ripple Set大小与最大Hop数需要在精度提升与噪声抑制间平衡,最佳结果出现在固定大小(如16个实体)与限定Hop范围(2-3 Hop)时。
  3. 解释性分析: Ripplenet的偏好传播不仅提高了推荐精度,还自动化地挖掘出用户与物品间可能的关联路径。实验样例如,“用户-电影-导演-新电影”链条提供了明确的推荐理由。


研究意义与未来展望

学术与实践价值

  1. Ripplenet是首个自然融合KG嵌入与路径特征的推荐框架,提出的偏好传播方法为KG增强推荐系统提供了新视角。
  2. 在多个实际场景中的性能验证表明,Ripplenet不仅在推荐精度上显著领先,还提供了高可解释性,为实际应用中的用户信任与接受度提升奠定了基础。

潜在挑战与改进方向

  1. 特征交互建模:未来研究可在实体-关系嵌入交互建模上进行更深层次探索。
  2. 高效采样技术:非均匀采样机制的设计将更好地捕获用户潜在兴趣。

总之,Ripplenet为推荐系统与知识图谱结合提供了全新的研究范式,其效果与潜力将在未来得到更广泛验证与拓展。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com