構造的な特徴とソフトな論理規則を共同学習することによる知識グラフの補完

近年来、知識グラフ(Knowledge Graph, KG)は多くの人工知能タスクで広く応用されています。知識グラフは、ヘッドエンティティ(head entity)、リレーション(relation)、およびテールエンティティ(tail entity)のトリプレット(Triplet)を使用して事物およびその関係を表現します。たとえば、典型的なトリプレット(h = Paris, r = capital_of, t = France)は現実世界の常識事実を表します。知識グラフはすでに多くの下流人工知能応用において重要な資源となり、たとえば、インテリジェントな質問応答、エンティティの曖昧性解消、意味ネットワーク検索、事実検証などがあります。しかし、現存の知識グラフは完璧ではなく、関係の欠如や誤りを含むことがあります。これらの問題に対処するために、知識グラフ埋め込み(Knowledge Graph Embedding, KGE)が主要な課題となっており、グラフ内の構造情報および潜在的な論理ルールを学習して欠如する事実を予測します。

研究背景

既存のKGEモデルは知識グラフの完備性をある程度向上させましたが、次の2つの未解決の課題に直面しています:(i)エンティティの局所構造特性と潜在的なソフトロジックルールを同時に利用して、より表現力のあるエンティティおよびリレーションの埋め込みを学習する方法;(ii)これらの2つの学習プロセスを統合して1つの統一モデルに組み込む方法、および最適なパフォーマンスを得る方法。

これらの問題を解決するために、本論文では新しいKGEモデルJSSKGEを提案します。このモデルは、エンティティの局所構造特性とソフトロジックルールの同時学習を可能にし、複数のデータセットを通じて実験的にその優れた性能を検証しました。

論文の出典

本論文の著者は、Weidong Li、Rong Peng、およびZhi Liであり、これらの著者はそれぞれ武漢大学計算機学院と広西師範大学計算機および情報工学学院に所属しています。この研究は2021年8月30日に発表され、IEEE Transactions on Knowledge and Data Engineering ジャーナルの第35巻第3号に掲載されました。

研究のワークフロー

本研究は、特定の実験やデータ処理方法によって支持されるいくつかの主要なステップから成ります。

1. 構造特性の学習

まず、グラフアテンションネットワーク(Graph Attention Networks, GATs)を用いてノードの局所構造情報を集約します。このネットワークはグラフ構造データを処理するために特別に設計され、各ノードの隣接ノードからの重要性を自動的に学習し、エンティティの構造特性をより正確に表現します。

2. ソフトロジックルールの利用

知識グラフに含まれるソフトロジックルールを使用して専門家としてエンティティおよびリレーションの埋め込みをさらに修正します。ソフトロジックルールはハードロジックルールとは異なり、ある程度の反例を許容し、関連ルールマイニングツール(例えばAMIE)を利用して自動的に取得できるため、手動ルール構築の高コストを回避できます。

3. 統合学習

グラフアテンションニューラルネットワークとソフトロジックルールを統合して学習することにより、新しい事実を予測するためのより多くの情報を含む埋め込みを得ることができます。本論文で提案されたJSSKGEモデルは、エンティティの構造情報とソフトロジックルールを統合し、4つの一般的なデータセットにおける実験結果が、現在最先端の方法よりも優れていることが示されました。

実験と結果

本論文では、FB15k、WN18、FB15k-237、およびWN18RRの4つの典型的なデータセットでJSSKGEを広範に実験評価しました。これらのデータセットは、異なる分野およびスケールの知識グラフを網羅しています:

  • FB15k:フリーべーシック知識グラフのサブセットで、映画、俳優、スポーツ、賞などに関する多くの事実を含んでいます。
  • WN18:WordNetのサブセットで、辞書および同義語辞典に関連する内容を主に含んでいます。
  • FB15k-237およびWN18RR:それぞれFB15kとWN18のサブセットで、テストリーク問題を排除し、モデルをより挑戦的かつ信頼性のあるものにすることを目的としています。

モデル評価指標

モデルの最終結果を評価するために、一般的に使用される指標には平均順位(Mean Rank, MR)、平均逆数順位(Mean Reciprocal Rank, MRR)、およびHits@K(予測結果の上位Kの比例)があります。特に、本論文では、訓練セットまたは検証セットに存在する関連候補エンティティによって順位異常が発生することを避けるために、フィルタされた評価指標を採用しました。

実験結果

FB15kおよびWN18データセット上の実験結果は、JSSKGEモデルがHits@10、Hits@3、Hits@1などの複数の指標で大多数の既存モデルよりも優れていることを示しました。特に、WN18データセットでのパフォーマンスは非常に優れていました。さらに、より挑戦的なFB15k-237およびWN18RRデータセットでも、JSSKGEモデルは高い頑強性および有効性を示しました:

  • FB15k-237:MRR、Hits@10、Hits@3、およびHits@1の指標で、JSSKGEモデルは他の複数の基準モデルを上回るパフォーマンスを示し、構造特性とソフトロジックルールの統合学習の妥当性を確認しました。
  • WN18RR:AnyBURL-EXTモデルがこのデータセットでより良いパフォーマンスを示しましたが、JSSKGEモデルも他のモデルと競り合う顕著な優位性を示しました。

パラメータの影響分析

超パラメータを調整する実験を通じて、UNSSKGEモデルにおける構造特性学習およびソフトロジックルールの相対的な重要性をさらに検証しました。結果は、どちらか一方の方法だけを使用しても最良の結果を得ることはできず、統合学習こそが両者の利点を最大限に発揮する唯一の方法であることを示しました。

アテンションウェイトの可視化

モデル内のグラフアテンション層のアテンションウェイトの変化傾向を可視化した結果、モデルは特定のエンティティ接続にますます注意を払うようになり、予測結果を最適化することが確認できました。これは、学習プロセスにおけるアテンションメカニズムの重要な役割をさらに検証したものです。

結論

本論文で提案されたJSSKGEモデルは、構造特性およびソフトロジックルールの統合学習によって、知識グラフ埋め込みの表現力および予測精度を効果的に向上させました。それにもかかわらず、このモデルには計算コストと空間資源の利用という点で改善の余地があるため、将来的な作業ではより効率的な構造特性学習方法を探求し、より複雑なロジックルールを導入してモデルの性能をさらに向上させる予定です。