推荐系统中基于知识图谱的上下文图注意力网络

基于知识图谱的推荐系统:Contextualized Graph Attention Network

近年来,随着在线信息和内容的爆炸式增长,推荐系统在电子商务网站和社交媒体平台等各种场景中变得越来越重要。这些系统通常旨在为用户提供她可能感兴趣的项目列表。然而,传统的基于用户行为数据的方法(例如协同过滤、深度学习)面临着数据稀疏性和冷启动问题。为了解决这些问题,研究者尝试将各种辅助信息 (side information) 融入到推荐系统中,其中包含用户的社交网络、评论文本等。

研究背景

在这些辅助信息中,项目知识图谱(Knowledge Graph, KG)包含丰富的项目间关系,并已被证明可以显著提高推荐系统的性能。知识图谱本质上是一个异构网络,其中节点代表实体,边代表关系。然而,如何将这些图谱信息有效地结合到推荐系统中仍然是一个挑战。已有的方法大致分为三类:基于正则化的方法、基于路径的方法和基于图神经网络(Graph Neural Networks, GNN)的方法。然而,这些方法存在一些缺陷,难以解决以下挑战:

  1. 挑战1:大多数基于GNN的方法在聚合本地图上下文时,没有考虑用户对实体的个性化偏好,从而导致推荐系统无法有效捕捉用户对于邻近信息的个性化需求。
  2. 挑战2:现有的方法在捕获实体的非本地图上下文(即高阶邻居)时效果不佳,因为知识图谱往往是不完整的,某些重要的实体之间的连接可能会缺失。
  3. 挑战3:用户的历史项目在预测她对候选项目的偏好时通常起重要作用。大多数以前的方法在学习用户表示时,直接聚合她的历史项目信息,忽略了不同历史项目对目标项目的重要性。

论文来源

这篇名为《Contextualized Graph Attention Network for Recommendation with Item Knowledge Graph》的论文由Yong Liu、Susen Yang、Yonghui Xu、Chunyan Miao、Min Wu和Juyong Zhang撰写,分别来自阿里巴巴集团、新加坡国立技术大学、南洋理工大学、山东大学、A*STAR等机构。收稿日期为2020年6月20日,修订日期为2021年4月28日,接受日期为2021年5月10日。论文于IEEE Transactions on Knowledge and Data Engineering (TKDE)发表,当前版本日期为2022年12月7日。

研究流程详述

研究方法

文中提出了一种新型推荐框架,称为Contextualized Graph Attention Network (CGAT),结合了局部和非局部图上下文信息,并利用用户历史行为数据进行推荐。

  1. 局部图上下文(Local Graph Context)

    • 使用用户特定的图注意力机制(User-specific Graph Attention Mechanism)来聚合邻居信息,不同用户对同一邻居实体的依赖程度会有所不同。
    • 将实体及其邻居的表示通过线性变换结合,并引入关系向量以理解邻居实体的重要性。
  2. 非本地图上下文(Non-Local Graph Context)

    • 设计了一种带偏随机游走采样策略(Biased Random Walk Sampling, BRWS)来提取非本地上下文。通过随机游走从目标实体开始生成多条路径,提取重要的高阶邻居。
    • 使用门控循环单元(Gated Recurrent Unit, GRU)对非本地上下文依赖进行建模,从而保留高频出现的上下文实体。
  3. 用户历史行为的上下文(User Interaction Graph Context)

    • 提出了项目特定的注意力机制(Item-specific Attention Mechanism),根据用户历史项目对候选项目进行加权处理,模型用户偏好。

实验与结果

该研究在真实数据集上进行了广泛的实验,并与现有的最先进的基于KG的推荐方法进行了比较,结果验证了CGAT的有效性。

  • 在FM、ML和DF数据集上,CGAT在精度和召回率方面均明显优于基准方法,如GraphSAGE、FMG、MCRec、CFKG、RippleNet、MKR、KGNN-LS和KGAT。
  • 在评估框架的不同组件时,发现局部和非本地上下文信息都能显著提高推荐的准确性。尤其是带偏随机游走方式对于非本地上下文的捕获,以及用户特定的图注意力机制在处理局部上下文时的有效性。
  • 进一步,通过对用户数据稀疏性的探讨,验证了CGAT在交互数据稀疏场景中的出色表现,主要由于框架能够有效整合来自KG的上下文信息。

结论及意义

CGAT模型在推荐系统中提供了新的思路,通过显式捕获知识图谱中的局部和非本地上下文信息,并结合用户的历史行为数据,显著增强了推荐系统的准确性和个性化服务能力。未来的研究可以进一步拓展CGAT在更多KG推荐场景中的应用,并探索更多种类的聚合策略以提升推荐效果。

本研究不仅在科学上具有重要意义,在实践应用上也提供了有效的技术手段,有助于电商平台和社交媒体等领域更精准地为用户推荐感兴趣的项目,提升用户体验和商业收益。