基于知识图谱的社交增强可解释推荐

基于知识图谱的社交增强可解释推荐系统

引言

随着互联网世界信息量的不断增加,用户和商品的相关信息也迅速扩展,导致信息过载问题日益严重。推荐系统通过为用户推荐少量符合其偏好的商品,能够有效缓解这一问题,不仅能帮助用户迅速获取感兴趣的内容,还能帮助企业实现精准营销,提升客户忠诚度。在电子商务、社交媒体和搜索引擎等多种平台上,推荐系统扮演着越来越重要的角色。

推荐系统的性能高度依赖于推荐技术。早期的协同过滤(Collaborative Filtering, CF)方法通过推荐与用户曾经互动过的物品相似的其他物品来实现推荐。然而,当用户与物品之间的互动稀疏时,CF方法效果不佳。为了解决这一限制,各种辅助信息如物品属性、用户信息和上下文被整合到模型中。尤其是,当侧信息被转化为特征向量并与用户和物品ID一起送入监督学习模型中时,虽然这种方法在一些场景中表现良好,但存在每次互动都被视为独立实例且无法从高阶邻居聚合信息的缺陷。近来,研究表明属性之间关系密切,因此可以组织成知识图谱(Knowledge Graph, KG)。在这一背景下,已经开发了许多方法来建模知识图谱的结构以用于推荐,这些方法可以分为正则化方法、路径方法和图神经网络(Graph Neural Network, GNN)方法。

目前多数工作主要考虑物品知识图谱,而忽视了社交影响对用户决策的影响。事实上,用户在决策时确实受到社交关系的影响,且这种影响是传递的。例如,用户A在朋友B的推荐下可能会对某一应用产生兴趣,而用户B的兴趣也会传递给其朋友。因此,全面建模社交图对于推荐系统的提升具有重大意义。

论文来源

该研究由以下作者完成:Chunyu Liu, Wei Wu, Siyu Wu, Lu Yuan, Rui Ding, Fuhui Zhou和Qihui Wu,他们分别来自南京邮电大学通信与信息工程学院、南京航空航天大学电子与信息工程学院、宾夕法尼亚州立大学教育学院学习与绩效系统部。本研究发表在《IEEE Transactions on Knowledge and Data Engineering》2024年2月第36卷第2期。

研究流程

研究对象及流程

  1. 数据构建:本文主要使用两个实际数据集,last-fm和yelp2018。last-fm数据集来源于在线音乐系统,包含用户对音乐家的评论和社交关系。yelp2018数据集来源于yelp挑战赛,包含用户对餐馆和酒吧的评分以及社交关系。最后,将这些数据构建为用户-物品交互图、物品知识图和用户社交图。

  2. 嵌入层:使用TransR模型对知识图谱进行嵌入,将实体和关系转化为向量,同时捕捉图的拓扑结构。TransR假设实体和关系不在同一语义空间中,并通过一个可训练矩阵将实体嵌入从实体空间投射到关系空间。嵌入的损失函数通过负采样方法优化。

  3. 用户聚合层:利用图卷积网络(Graph Convolutional Network, GCN)框架递归聚合邻居节点的信息。同时,设计了节点级别的注意力机制来突出对中心节点重要的节点。在社交图中,通过集成朋友的影响来生成新的用户向量。

  4. 图级注意力网络:设计了图级别的注意力网络来为用户生成区分CKG和USG信息的权重。最终的用户侧信息由来自CKG和USG的信息线性组合得来。

  5. 项目聚合:项目的侧信息通过CKG中的高阶邻居节点聚合得到。

  6. 高阶连接学习:通过多层堆叠,用户和物品能聚合来自更高阶邻居的信息。最终通过多层堆叠,捕获高阶连接,并拼接前几层的输出作为最终用户和物品的嵌入。

  7. 推断层:通过线性层和激活函数对表示进行预测,得到推荐评分函数,并用于排序推荐。

实验与结果

文章进行了广泛的实验来验证模型的有效性,并通过实验数据展示出建议系统在不同场景下与其他最先进的方法相比性能更优。

  1. 实验结果:在多个Top-K推荐任务中,本文的模型在HR、NDCG、Recall和Precision指标上均取得了最佳表现。特别在用户分组中,无论是高互动频率用户组还是稀疏互动用户组,我方模型在last-fm和yelp2018上都显现出稳定且优异的表现,特别是在高互动频率用户组表现尤为突出,证明了本模型能有效捕捉用户的真实偏好。

  2. 组件影响性分析:通过设计不同的模型变体,验证了多层次注意力算法和知识图谱嵌入在模型中的重要性。结果显示,多层次的注意力机制和高阶邻居关系的聚合显著提升了模型表现。

  3. 具体案例分析:通过社交图CKG和USG中的路径选择,模型能够准确捕捉用户的真实偏好。例如,通过路径u25→i580→e45819→i45,模型成功捕捉到用户u25对特定饭店的偏好,并通过社交关系准确推荐新项目。

结论

本文提出了一种全新的基于社交增强知识图谱注意力网络(SKGAN)的可解释推荐方案。通过综合利用共同知识图(CKG)和用户社交图(USG),本文丰富了用户和物品的嵌入表示,并通过GCNs大大增强了模型对高阶语义信息的捕捉能力。实验结果验证了模型在实际任务中的有效性和优越性,证明了引入社交图谱挖掘高阶连接信息能够显著提升推荐系统的表现。未来的研究将探讨更多的用户和物品侧信息以进一步优化推荐系统的性能。

研究意义与价值

本文的方法不仅在学术上推动了基于知识图谱推荐系统的研究,还在实际应用中提供了有效的解决方案,可以广泛应用于电子商务、社交媒体等领域的精确推荐,真正实现了用户个性化推荐的需求。通过一系列创新的算法设计和实验验证,本文的方法显著提升了推荐性能,具有广泛的应用价值和研究意义。