基于图的非抽样策略增强知识图谱推荐系统
基于图的无采样知识图谱增强推荐
近年来,知识图谱(Knowledge Graph, KG)增强推荐系统,旨在解决冷启动问题和推荐系统的可解释性,已经吸引了大量的研究兴趣。现有的推荐系统通常侧重于隐式反馈,如购买历史记录,但缺乏负反馈。大多数系统采用负采样策略处理隐式反馈数据,这可能忽略了潜在的正用户-项目交互。而其他一些工作则采用无采样策略,将所有未观察到的交互视为负样本,并为每个负样本分配权重,以表示该样本为正样本的概率。然而,这些方法使用简单直观的权重分配策略,不能捕捉所有交互数据中的潜在关系。
研究背景与动机
随着互联网的快速发展,信息超载的问题日益严重。为了提高用户的搜索体验并增加产品供应商的收入,推荐系统应运而生,并在电子商务、社交网络等多个应用中取得了巨大成功。近年来,作为内容信息的知识图谱引入推荐系统,解决了冷启动和可解释性问题。例如,仅通过四个用户的观看历史记录,电影《阿凡达》无法推荐给用户1和用户2,但通过相关的知识信息(如共同导演詹姆斯·卡梅隆)连接后,可以生成更准确和合理的推荐结果。大多数现有的方法集中在探索将知识信息和用户-项目交互数据结合到不同推荐系统中的新架构,如卷积神经网络(CNN)、注意机制、图神经网络(GNN)等。
研究来源和作者信息
本文由Shuang Liang、Jie Shao、Jiasheng Zhang及Bin Cui撰写,分别隶属于电子科技大学计算机与工程学院未来媒体中心,电子科技大学四川人工智能研究院等研究机构,论文于2023年9月发表在IEEE Transactions on Knowledge and Data Engineering期刊。
研究内容与流程
本文提出了一种基于图的无采样策略,实现了在知识图谱增强推荐中的高效性能。提出的方法利用节点中心性显著提高推荐性能,同时结合了知识图谱嵌入和推荐任务,通过本地聚合块高效捕捉知识图谱增强推荐中的高阶连接信息。在三个数据集上的实验表明,本文提出的方法具有竞争性的效率,达到了最新的研究水平。
研究流程
- 用户-项目交互数据的处理:研究首先将用户-项目交互数据转换成图结构数据。
- 节点中心性计算:使用节点中心性确定每个节点,特别是知识图谱中节点的权重分配。
- 知识图谱嵌入:利用知识图谱结构信息训练嵌入。
- 多跳顶k邻居聚合:捕捉高阶连接信息,依据节点中心性对目标节点采样最重要的邻居节点,并更新这些节点的嵌入。
- 模型优化:最终使用非采样策略的损失函数来优化模型参数。
实验与结果分析
本文在Amazon-Book、Yelp2018和Last-FM三个公开数据集上进行了广泛的实验,表明本文提出的方法在推荐性能和效率方面均优于现有的最先进方法。具体实验结果包含以下几个方面:
- 推荐性能比较:本文方法在所有数据集上均取得了最好成绩,尤其在用户-项目交互稀疏度低的情况下,性能提升最为显著。
- 组策略效果:对比了不同权重分配策略(如统一分配、随机分配、频率分配、度中心性和PageRank中心性),证实了PageRank中心性在推荐中的有效性。
- 多跳顶k邻居聚合效果:多层次的邻居采样和信息聚合,可以更好地捕捉高阶连接信息,显著提高推荐准确性。
结论与价值
本文提出的基于图的无采样策略不仅在计算效率上具有显著优势,而且明显提高了知识图谱增强推荐系统的推荐性能。通过引入图结构信息,可以更加合理地分配负样本的权重,捕捉高阶连接信息。这对于电子商务、社交网络等数据稀疏的推荐场景具有重要的应用价值。
亮点与创新
- 树立新的研究范例:通过将图结构信息引入非采样策略,本文提出的方法为知识图谱增强推荐系统提供了一种新的方案。
- 高效计算:本文的方法不仅提高了推荐准确性,而且保持了计算效率,相比传统的方法,有明显的速度提升。
- 多跳顶k邻居采样:该方法在聚合时通过选择最重要的邻居节点,高效捕捉高阶连接信息,提升推荐质量。
未来工作将进一步探索先进的图神经网络及不同的节点中心性算法,以优化基于图的无采样策略的效果。