Recommandation explicable améliorée par les réseaux sociaux avec le graphe de connaissance

Système de recommandation explicable amélioré par le social basé sur le graphe de connaissances

Introduction

Avec l’augmentation constante du volume d’informations dans le monde d’Internet, les informations relatives aux utilisateurs et aux produits se sont également rapidement étendues, entraînant un problème croissant de surcharge d’informations. Les systèmes de recommandation peuvent atténuer efficacement ce problème en recommandant aux utilisateurs un petit nombre de produits correspondant à leurs préférences, ce qui permet non seulement aux utilisateurs de trouver rapidement le contenu qui les intéresse, mais aussi aux entreprises de réaliser un marketing précis et d’améliorer la fidélité des clients. Les systèmes de recommandation jouent un rôle de plus en plus important sur diverses plateformes telles que le commerce électronique, les médias sociaux et les moteurs de recherche.

La performance des systèmes de recommandation dépend fortement des techniques de recommandation. Les méthodes de filtrage collaboratif (Collaborative Filtering, CF) initiales recommandent des articles similaires à ceux avec lesquels l’utilisateur a déjà interagi. Cependant, lorsque les interactions entre utilisateurs et articles sont rares, les méthodes CF ne sont pas efficaces. Pour résoudre cette limitation, diverses informations auxiliaires telles que les attributs des articles, les informations utilisateur et le contexte sont intégrées dans le modèle. Surtout, lorsque ces informations latérales sont converties en vecteurs de caractéristiques et envoyées dans un modèle d’apprentissage supervisé avec les ID des utilisateurs et des articles, cette méthode fonctionne bien dans certains contextes mais présente des faiblesses, notamment le fait que chaque interaction est considérée comme un cas isolé et ne peut pas agréger des informations à partir de voisins de haut niveau. Récemment, des recherches ont montré que les attributs sont étroitement liés et peuvent donc être organisés en graphiques de connaissances (Knowledge Graph, KG). Dans ce contexte, de nombreuses méthodes de modélisation de la structure du graphe de connaissances ont été développées pour les recommandations, et ces méthodes peuvent être divisées en méthodes de régularisation, méthodes de chemin et méthodes de réseau de neurones graphiques (Graph Neural Network, GNN).

La plupart des travaux actuels se concentrent principalement sur le graphe de connaissances des articles, en ignorant l’influence sociale sur les décisions des utilisateurs. En fait, les utilisateurs sont influencés par leurs relations sociales lors de la prise de décision, et cette influence est transmissible. Par exemple, l’utilisateur A peut être intéressé par une application recommandée par son ami B, et l’intérêt de B peut également être transmis à ses amis. Par conséquent, la modélisation complète du graphe social est d’une grande importance pour améliorer les systèmes de recommandation.

Source de l’article

Cette recherche a été menée par les auteurs suivants : Chunyu Liu, Wei Wu, Siyu Wu, Lu Yuan, Rui Ding, Fuhui Zhou et Qihui Wu, qui proviennent respectivement de l’École de génie des télécommunications et de l’information de l’Université des Postes et Télécommunications de Nanjing, de l’École de génie électronique et de l’information de l’Université de l’Aéronautique et de l’Astronautique de Nanjing et du Département des systèmes d’apprentissage et de performance de l’Université d’État de Pennsylvanie. Cette recherche a été publiée dans le “IEEE Transactions on Knowledge and Data Engineering”, Volume 36, Numéro 2, Février 2024.

Processus de recherche

Objets de recherche et processus

  1. Construction des données : Cet article utilise principalement deux jeux de données réels, last-fm et yelp2018. Le jeu de données last-fm provient d’un système de musique en ligne et contient les commentaires des utilisateurs sur les musiciens et les relations sociales. Le jeu de données yelp2018 provient du concours yelp et contient les évaluations des utilisateurs sur les restaurants et bars ainsi que les relations sociales. Enfin, ces données sont construites en un graphe d’interactions utilisateur-article, un graphe de connaissances des articles et un graphe social des utilisateurs.

  2. Niveau d’intégration : Le modèle TransR est utilisé pour intégrer le graphe de connaissances, en transformant les entités et les relations en vecteurs tout en capturant la structure topologique du graphe. TransR suppose que les entités et les relations ne sont pas dans le même espace sémantique et projette les intégrations des entités de l’espace des entités vers l’espace des relations à l’aide d’une matrice entraînable. La fonction de perte de l’intégration est optimisée par la méthode de l’échantillonnage négatif.

  3. Niveau d’agrégation des utilisateurs : Les informations des nœuds voisins sont récursivement agrégées à l’aide du cadre Graph Convolutional Network (GCN). De plus, un mécanisme d’attention au niveau des nœuds est conçu pour mettre en avant les nœuds importants pour le nœud central. Dans le graphe social, l’influence des amis est intégrée pour générer de nouveaux vecteurs utilisateurs.

  4. Réseau d’attention au niveau du graphe : Un réseau d’attention au niveau du graphe est conçu pour générer des pondérations différenciant les informations entre le CKG et l’USG pour l’utilisateur. Les informations côté utilisateur finales sont obtenues par la combinaison linéaire des informations provenant du CKG et de l’USG.

  5. Agrégation des articles : Les informations latérales des articles sont agrégées à partir des nœuds voisins de haut niveau dans le CKG.

  6. Apprentissage des connexions de haut niveau : Par le biais de plusieurs niveaux empilés, les utilisateurs et les articles peuvent agréger des informations à partir de voisins de plus haut niveau. En fin de compte, par empilement multiple, les connexions de haut niveau sont capturées et les sorties des couches précédentes sont concaténées pour former les intégrations finales des utilisateurs et des articles.

  7. Niveau d’inférence : Les représentations sont prédites à l’aide d’une couche linéaire et d’une fonction d’activation pour obtenir une fonction de notation de recommandation utilisée pour classer les recommandations.

Expériences et résultats

L’article a réalisé des expériences approfondies pour vérifier l’efficacité du modèle et a démontré à travers des données expérimentales que le système de recommandation surpasse d’autres méthodes de pointe dans divers contextes.

  1. Résultats expérimentaux : Dans de nombreuses tâches de recommandation Top-K, le modèle de cet article a obtenu les meilleures performances sur les indicateurs HR, NDCG, Recall et Precision. En particulier, dans les groupes utilisateurs, qu’il s’agisse de groupes d’utilisateurs à forte fréquence d’interaction ou de groupes d’utilisateurs à interactions rares, le modèle sur last-fm et yelp2018 a montré des performances stables et excellentes, notamment dans le groupe à forte fréquence d’interaction, prouvant que ce modèle peut capturer efficacement les véritables préférences des utilisateurs.

  2. Analyse de l’impact des composants : En concevant différentes variantes du modèle, l’importance de l’algorithme d’attention multiniveau et de l’intégration du graphe de connaissances dans le modèle a été vérifiée. Les résultats montrent que le mécanisme d’attention multiniveau et l’agrégation des relations de voisins de haut niveau améliorent significativement les performances du modèle.

  3. Analyse de cas spécifiques : En sélectionnant des chemins dans le graphe social CKG et USG, le modèle peut capturer avec précision les véritables préférences des utilisateurs. Par exemple, grâce au chemin u25→i580→e45819→i45, le modèle a capturé avec succès la préférence de l’utilisateur u25 pour un restaurant spécifique et a recommandé avec précision de nouveaux articles grâce aux relations sociales.

Conclusion

Cet article propose un nouveau schéma de recommandation explicable basé sur un réseau d’attention de graphe de connaissances amélioré par le social (SKGAN). En utilisant de manière exhaustive le graphe de connaissances communes (CKG) et le graphe social des utilisateurs (USG), cet article enrichit les représentations des intégrations des utilisateurs et des articles et améliore considérablement la capacité du modèle à capturer des informations sémantiques de haut niveau grâce aux GCNs. Les résultats expérimentaux ont vérifié l’efficacité et la supériorité du modèle dans des tâches réelles, prouvant que l’introduction du graphe social pour explorer les informations de connexions de haut niveau peut améliorer significativement les performances des systèmes de recommandation. Les recherches futures exploreront davantage d’informations latérales des utilisateurs et des articles pour optimiser encore plus les performances des systèmes de recommandation.

Signification et valeur de la recherche

La méthode présentée dans cet article pousse non seulement la recherche académique sur les systèmes de recommandation basés sur les graphes de connaissances, mais fournit également une solution efficace dans les applications pratiques, pouvant être largement utilisée dans des domaines tels que le commerce électronique et les médias sociaux pour des recommandations précises, répondant véritablement aux besoins de recommandations personnalisées des utilisateurs. À travers une série de conceptions algorithmiques innovantes et des validations expérimentales, la méthode proposée dans cet article améliore significativement les performances de recommandation, ayant une grande valeur d’application et une signification de recherche étendue.