m𝟐ixkg:知识图谱中更难负样本的混合

学术报告 背景介绍 知识图谱(knowledge graph,KG)是记录实体和关系信息的结构化数据,广泛应用于问答系统、信息检索、机器阅读等领域。知识图谱嵌入(Knowledge Graph Embedding, KGE)技术通过将图谱中的实体和关系映射到低维稠密向量空间,大大提升了相关应用的性能。然而,在KGE模型的训练过程中,如何生成高质量的负样本(negative samples)至关重要。 目前主流的KGE模型在生成负样本时面临诸多挑战。一些模型使用简单的静态分布,如均匀分布或伯努利分布(Sampling from Uniform or Bernoulli distribution),这些方法生成的负样本通常缺乏区分度。而且,现有方法在生成负样本时,通常只是从知识图谱中已经存在的实...