本文是由Shaoxiong Ji、Shirui Pan、Erik Cambria、Pekka Marttinen和Philip S. Yu共同撰写的一篇综述性论文,发表于2021年的《IEEE Transactions on Neural Networks and Learning Systems》期刊。该论文对知识图谱(Knowledge Graph, KG)的研究进行了全面的回顾,涵盖了知识图谱表示学习、知识获取与补全、时序知识图谱以及知识感知应用等多个领域。本文的主要目标是为未来的研究提供方向,并总结了近年来在知识图谱领域的突破性进展。
知识图谱作为一种结构化的知识表示形式,近年来在人工智能领域受到了广泛关注。知识图谱通过实体(Entities)、关系(Relations)和语义描述(Semantic Descriptions)来表示事实,能够帮助智能系统解决复杂的任务。知识图谱的研究不仅涉及知识的表示与推理,还包括知识的获取、补全以及在实际应用中的使用。本文旨在对知识图谱的各个方面进行系统性的综述,并为未来的研究提供新的分类和视角。
知识图谱表示学习(Knowledge Representation Learning, KRL)是知识图谱研究的核心问题之一。KRL的目标是将实体和关系映射到低维向量空间中,同时捕捉它们的语义信息。本文从四个方面对KRL进行了详细讨论:
表示空间:实体和关系可以在不同的数学空间中进行表示,如欧几里得空间、复数空间、高斯分布空间和流形空间等。不同的表示空间具有不同的优势,例如复数空间能够捕捉对称和反对称关系,而高斯分布空间则能够处理实体和关系的不确定性。
评分函数:评分函数用于衡量事实的合理性,常见的评分函数包括基于距离的评分函数和基于语义匹配的评分函数。基于距离的评分函数通常使用平移原则(如TransE模型),而基于语义匹配的评分函数则通过乘法运算来捕捉实体和关系之间的语义相似性。
编码模型:编码模型用于捕捉实体和关系之间的交互,常见的编码模型包括线性/双线性模型、因子分解模型和神经网络模型。近年来,卷积神经网络(CNN)、图神经网络(GNN)和Transformer等深度学习模型在知识图谱表示学习中得到了广泛应用。
辅助信息:除了知识图谱本身的结构信息外,外部信息如文本描述、类型信息和视觉信息等也可以用于增强知识表示。例如,文本描述可以帮助捕捉实体的语义信息,而视觉信息则可以为实体提供更丰富的表示。
知识获取是知识图谱研究中的另一个重要方向,主要任务包括知识图谱补全(Knowledge Graph Completion, KGC)、实体发现和关系抽取。KGC的目标是通过预测缺失的三元组来补全知识图谱,常见的子任务包括链接预测、实体预测和关系预测。本文详细讨论了基于嵌入的方法、关系路径推理、基于规则的推理以及元关系学习等多种KGC方法。
基于嵌入的方法:这些方法通过学习实体和关系的低维嵌入向量来进行预测。常见的嵌入模型包括TransE、TransH、TransR等。这些方法虽然在某些基准数据集上表现良好,但难以捕捉复杂的多步关系。
关系路径推理:为了捕捉多步关系,关系路径推理方法通过利用知识图谱中的路径信息来进行推理。例如,随机游走推理和基于神经网络的路径推理方法能够有效地捕捉长距离的依赖关系。
基于规则的推理:逻辑规则是知识图谱推理中的另一种重要方法。通过将逻辑规则注入到嵌入模型中,可以提高推理的准确性和可解释性。例如,KALE模型通过结合模糊逻辑和嵌入模型来进行推理。
元关系学习:元关系学习(Meta Relational Learning)旨在通过少量样本来预测新的关系事实。这类方法通常使用元学习(Meta-Learning)技术来快速适应新的关系。
时序知识图谱(Temporal Knowledge Graph)是近年来新兴的研究方向,旨在捕捉知识图谱中的时间信息。时序知识图谱的研究包括时序嵌入、实体动态、时序关系依赖和时序逻辑推理等。时序知识图谱能够更好地反映知识的动态变化,适用于需要时间感知的应用场景。
知识图谱在许多实际应用中发挥了重要作用,包括自然语言理解(NLU)、问答系统、推荐系统等。通过将知识图谱与深度学习模型结合,这些应用能够更好地进行常识推理和语义理解。例如,微软的Satori和谷歌的知识图谱都是知识图谱在实际应用中的成功案例。
本文最后对知识图谱的未来研究方向进行了展望,提出了几个有潜力的研究方向,包括基于Transformer的知识编码、图神经网络的知识传播、基于强化学习的路径推理以及元关系学习等。这些方向有望进一步推动知识图谱研究的发展。
本文的主要贡献在于: - 全面综述:对知识图谱的起源、现代技术及其应用进行了全面的回顾,涵盖了知识表示学习、知识获取、时序知识图谱和知识感知应用等多个方面。 - 新的分类与分类法:提出了知识图谱研究的全视角分类,并对知识表示学习、知识获取等任务进行了细粒度的分类。 - 新兴进展的广泛覆盖:涵盖了基于Transformer的知识编码、图神经网络的知识传播、基于强化学习的路径推理等新兴研究方向。 - 未来方向的总结与展望:总结了每个研究领域的最新进展,并提出了未来的研究方向。
总的来说,本文为知识图谱领域的研究者提供了一个全面的参考框架,并为未来的研究提供了新的思路和方向。