为了更好地帮助中国学术社区理解本文对推荐系统的研究贡献,我们为您提供一篇基于Ripplenet研究论文的综合学术报告:
作者及出版信息:
本文由Hongwei Wang等研究人员联合完成,作者所属机构包括上海交通大学、Microsoft Research Asia、美团点评集团以及香港理工大学等。论文发表在2018年10月22-26日于意大利都灵召开的第27届ACM国际信息与知识管理会议(CIKM ’18)上,并附有DOI链接(https://doi.org/10.1145⁄3269206.3271739)。
随着互联网内容与服务数量的爆炸性增长(如新闻、书籍、电影等),个性化推荐系统(Recommender Systems, RS)的作用愈加重要。协同过滤(Collaborative Filtering, CF)作为推荐策略的核心,利用用户的历史交互行为探索潜在偏好,取得了良好效果。但CF面临以下诸多挑战: 1. 数据稀疏性问题:用户-物品交互矩阵通常极为稀疏。 2. 冷启动问题:对于新用户或新物品,历史交互信息有限,推荐效果受限。
解决这些问题的一个方向是引入辅助信息(Side Information),如社交网络、物品属性及上下文语境等。然而,知识图谱(Knowledge Graph, KG)因其能描述物品间丰富且多样的连接关系,已成为研究热点。学术界和行业内涌现出了诸多高质量知识图谱(如DBpedia、Google Knowledge Graph和Microsoft Satori),广泛应用于多种任务(如知识图谱补全、问答系统等)。
已有的KG感知推荐方法分为两类: 1. 嵌入式方法:通过知识图谱嵌入(Knowledge Graph Embedding, KGE)获取实体嵌入,例如CKE模型。 2. 基于路径的方法:提取KG中的元路径或元图特征建立用户与物品间联系,例如PER和Meta-Graph推荐方法。
然而,这两类方法各有不足:嵌入方法难以直观地表征物品间的关系,路径方法则过于依赖手工设计的元路径。为此,本文提出Ripplenet框架,结合两种方法的优势,通过用户偏好的递归传播发现其在知识图谱中的分层潜在兴趣,从而提高推荐效果。
Ripplenet是一种端到端框架,设计用于点击率预测(Click-Through Rate, CTR)。其核心机制被称为偏好传播(Preference Propagation),以用户历史兴趣为种子集,通过KG中的实体-关系-实体链路递归扩展用户兴趣,模拟如涟漪(Ripple)传播般的递层用户偏好生成机制。此框架的主要流程包括: 1. 输入:用户与候选物品对。 2. 偏好传播:激活用户历史点击物品在KG中的相关实体(称为Ripple Sets),并逐层迭代传播初始兴趣。 3. 预测生成:通过多层偏好响应生成的用户嵌入,与候选物品的嵌入结合,计算CTR点击概率。
Ripple Set生成:KG中的Ripple Set定义为用户点击历史物品通过某k-Hop链路连接的实体集合。较近的Hop通常带来更高的相关性,远距离Hop可能带噪声。
偏好传播计算:针对Ripple Set中每个三元组(头实体、关系、尾实体),通过Softmax计算候选物品与头实体间的相关性权重,并以此加权尾实体嵌入来生成用户的k次响应。
用户嵌入综合:多级响应(如1-Hop、2-Hop等)通过加权叠加形成最终用户嵌入。
优化目标:Ripplenet的训练旨在优化CTR预测,融合KG的结构约束与正则化,对用户、物品及关系嵌入进行学习。在模型优化中,负采样(Negative Sampling)进一步增强了训练效率。
研究人员在电影(MovieLens-1M)、书籍(Book-Crossing)、新闻(Bing-News)三个真实场景中验证Ripplenet的性能,具体结果如下:
| 数据集 | 用户数 | 物品数 | 交互数 | KG triples(1-Hop至4-Hop) | |———|——–|———|———|—————————-| | MovieLens | 6,036 | 2,445 | 753,772 | 20,782⁄178,049/318,266等 |
对比模型:包括CKE、SHINE、DKN、PER等基于KG的经典推荐模型,以及通用推荐工具(LibFM, Wide&Deep)。
评价指标:AUC(曲线下面积)、Accuracy(准确率)、Precision@K等。
总体比较:
参数优化:
解释性分析: Ripplenet的偏好传播不仅提高了推荐精度,还自动化地挖掘出用户与物品间可能的关联路径。实验样例如,“用户-电影-导演-新电影”链条提供了明确的推荐理由。
总之,Ripplenet为推荐系统与知识图谱结合提供了全新的研究范式,其效果与潜力将在未来得到更广泛验证与拓展。