Réseau d'attention graphique contextualisé pour les recommandations avec un graphe de connaissances des articles
Système de recommandation basé sur le graphe de connaissances : Réseau d’Attention Contextualisé par Graphe
Ces dernières années, avec la croissance exponentielle des informations et contenus en ligne, les systèmes de recommandation sont devenus de plus en plus importants dans divers scénarios tels que les sites de commerce électronique et les plateformes de médias sociaux. Ces systèmes visent généralement à fournir à l’utilisateur une liste d’articles qui pourraient l’intéresser. Cependant, les méthodes traditionnelles basées sur les données comportementales des utilisateurs (par exemple, le filtrage collaboratif, l’apprentissage profond) sont confrontées à des problèmes de rareté des données et de démarrage à froid. Pour résoudre ces problèmes, les chercheurs ont tenté d’intégrer diverses informations auxiliaires (side information) dans les systèmes de recommandation, y compris le réseau social des utilisateurs, les textes des critiques, etc.
Contexte de la recherche
Parmi ces informations auxiliaires, le graphe de connaissances des articles (Knowledge Graph, KG) contient des relations riches entre les articles et s’est avéré capable d’améliorer de manière significative les performances des systèmes de recommandation. Le graphe de connaissances est essentiellement un réseau hétérogène où les nœuds représentent des entités et les arêtes représentent des relations. Cependant, il reste un défi de combiner efficacement ces informations de graphe dans les systèmes de recommandation. Les méthodes existantes peuvent être grossièrement classées en trois catégories : les méthodes basées sur la régularisation, les méthodes basées sur les chemins et les méthodes basées sur les réseaux neuronaux graphes (Graph Neural Networks, GNN). Cependant, ces méthodes présentent certains défauts et il est difficile de relever les défis suivants :
- Défi 1 : La plupart des méthodes basées sur les GNN n’intègrent pas les préférences personnalisées des utilisateurs lors de l’agrégation du contexte local du graphe, ce qui empêche le système de recommandation de capturer efficacement les besoins personnalisés des utilisateurs en matière d’informations de voisinage.
- Défi 2 : Les méthodes existantes sont inefficaces pour capturer le contexte non local des entités (c’est-à-dire les voisins de haut niveau) car les graphes de connaissances sont souvent incomplets et certaines connexions importantes entre les entités peuvent manquer.
- Défi 3 : Les anciens articles consultés par l’utilisateur jouent généralement un rôle important dans la prédiction de ses préférences pour les futurs articles. La plupart des méthodes précédentes négligent l’importance relative des anciens articles par rapport aux articles cibles lors de l’apprentissage de la représentation utilisateur.
Source de l’article
Cet article, intitulé « Contextualized Graph Attention Network for Recommendation with Item Knowledge Graph », est rédigé par Yong Liu, Susen Yang, Yonghui Xu, Chunyan Miao, Min Wu et Juyong Zhang, affiliés respectivement au groupe Alibaba, à l’Université de Technologie de Nanyang, à l’Université de Shandong, à A*STAR, etc. L’article a été soumis le 20 juin 2020, révisé le 28 avril 2021 et accepté le 10 mai 2021. Il a été publié dans l’IEEE Transactions on Knowledge and Data Engineering (TKDE), et la date de la version actuelle est le 7 décembre 2022.
Détails du flux de recherche
Méthodologie
Cet article propose un nouveau cadre de recommandation appelé Contextualized Graph Attention Network (CGAT), qui combine les informations contextuelles locales et non locales du graphe et utilise les données de comportement historique des utilisateurs pour la recommandation.
Contexte local du graphe (Local Graph Context) :
- Utilisation d’un mécanisme d’attention de graphe spécifique à l’utilisateur (User-specific Graph Attention Mechanism) pour agréger les informations des voisins, où la dépendance de différents utilisateurs envers la même entité voisine est différente.
- Intégration des représentations des entités et de leurs voisins par des transformations linéaires et ajout d’un vecteur de relation pour comprendre l’importance des entités voisines.
Contexte non local du graphe (Non-Local Graph Context) :
- Conception d’une stratégie d’échantillonnage aléatoire biaisée (Biased Random Walk Sampling, BRWS) pour extraire le contexte non local. Par des marches aléatoires à partir de l’entité cible, on génère plusieurs chemins pour extraire les voisins de haut niveau importants.
- Modélisation de la dépendance contextuelle non locale à l’aide d’une unité récurrente à portes (Gated Recurrent Unit, GRU) pour conserver les entités contextuelles apparaissant fréquemment.
Contexte du graphe d’interaction utilisateur (User Interaction Graph Context) :
- Proposition d’un mécanisme d’attention spécifique à l’article (Item-specific Attention Mechanism) pour pondérer les articles historiques de l’utilisateur par rapport aux articles candidats, modélisant ainsi les préférences de l’utilisateur.
Expériences et résultats
Cette recherche a conduit des expériences approfondies sur des jeux de données réels et a comparé les résultats avec les méthodes de recommandation basées sur KG existantes, démontrant ainsi l’efficacité de CGAT.
- Sur les ensembles de données FM, ML et DF, CGAT a montré des améliorations significatives en termes de précision et de taux de rappel par rapport aux méthodes de référence telles que GraphSAGE, FMG, MCRec, CFKG, RippleNet, MKR, KGNN-LS et KGAT.
- En évaluant différentes composantes du cadre, il a été constaté que les informations contextuelles locales et non locales amélioraient notablement la précision des recommandations. En particulier, la méthode d’échantillonnage biaisée pour capturer le contexte non local et le mécanisme d’attention de graphe spécifique à l’utilisateur étaient efficaces pour traiter le contexte local.
- De plus, en examinant la rareté des données des utilisateurs, CGAT a démontré des performances exceptionnelles dans les scénarios où les données d’interaction sont rares, essentiellement grâce à l’intégration efficace des informations contextuelles issues du KG.
Conclusion et implications
Le modèle CGAT offre une nouvelle approche pour les systèmes de recommandation en capturant explicitement les informations contextuelles locales et non locales des graphes de connaissances, tout en intégrant les données de comportement historique des utilisateurs, améliorant ainsi de manière significative la précision et la capacité de personnalisation des systèmes de recommandation. Les recherches futures pourraient étendre l’application de CGAT à d’autres scénarios de recommandation basés sur KG et explorer diverses stratégies d’agrégation pour améliorer encore les résultats de recommandation.
Cette recherche présente non seulement une signification scientifique importante, mais fournit également des moyens techniques efficaces pour des applications pratiques, aidant les plateformes de commerce électronique et les médias sociaux à recommander plus précisément aux utilisateurs les articles qui les intéressent, améliorant ainsi l’expérience utilisateur et les recettes commerciales.