Une représentation multi-graphique pour l'extraction d'événements
Introduction: L’extraction d’événements est une tâche populaire dans le domaine du traitement du langage naturel, visant à identifier les mots déclencheurs d’événements et leurs arguments associés à partir d’un texte donné. Cette tâche est généralement divisée en deux sous-tâches: la détection d’événements (extraction des mots déclencheurs d’événements) et l’extraction d’arguments. L’approche pipeline traditionnelle exécute ces deux sous-tâches séparément, mais souffre du problème de la propagation d’erreurs. Ces dernières années, les modèles jointes ont émergé, capables d’apprendre ces deux sous-tâches de manière unifiée afin d’éviter la propagation d’erreurs, mais ignorent toujours le problème du multiplexage d’arguments (argument multiplexing).
Résumé de l’article: Cet article propose un cadre d’extraction d’événements basé sur une représentation de multigraphe. Le multigraphe permet à deux nœuds d’avoir plusieurs arêtes parallèles, pouvant ainsi bien représenter la structure sémantique des événements et résoudre le problème du multiplexage d’arguments. Sur la base de ce cadre, les auteurs ont conçu un modèle d’extraction d’événements de bout en bout basé sur le multigraphe (MGREE) capable d’extraire simultanément les mots déclencheurs d’événements, les arguments associés et leurs rôles sémantiques.
Institutions de recherche et auteurs: Cette recherche a été soutenue par le programme national clé de R&D de Chine et réalisée en collaboration par des chercheurs du Laboratoire clé d’ingénierie du ministère de l’Éducation pour le calcul de texte et l’intelligence cognitive de l’Université du Guizhou et du Département d’informatique de l’Université de Xi’an Jiaotong. Le premier auteur est Hui Huang de l’Université du Guizhou, et les auteurs correspondants sont Yanping Chen et Yongbin Qin de l’Université du Guizhou.
Processus de recherche: (a) Tokeniser la phrase d’entrée, utiliser des modèles de langue pré-entraînés comme BERT et des embeddings de mots Skip-gram pour générer les représentations des nœuds; (b) Construire un tenseur 3D de taille N×N×K en tant que représentation de multigraphe, où N est le nombre de tokens dans la phrase et K le nombre de types d’annotation (comprenant les types d’événements, les types d’arguments et les types de rôles sémantiques); © Apprendre les scores de confiance de chaque arête basés sur un mécanisme d’attention pour obtenir la représentation de multigraphe; (d) Concevoir un algorithme de décodage d’événements basé sur des règles pour extraire les mots déclencheurs d’événements et leurs rôles d’arguments à partir de la représentation de multigraphe.
Principaux résultats: Les expériences menées sur 4 jeux de données publics tels que ACE05 ont montré que le modèle MGREE obtient les meilleures performances de pointe pour la tâche d’extraction d’événements, avec une augmentation d’environ 4% de la valeur F1 par rapport aux modèles existants les plus performants. Des analyses expérimentales ont démontré que la représentation de multigraphe résout efficacement le problème du multiplexage d’arguments et améliore la capacité de discrimination des réseaux de neurones pour l’extraction d’événements.
Signification de la recherche: (1) Proposition de la représentation de multigraphe, capable de représenter efficacement la structure sémantique des événements et de résoudre le problème du multiplexage d’arguments; (2) Conception du modèle d’extraction d’événements de bout en bout MGREE obtenant les meilleures performances de pointe; (3) Analyse des avantages de la représentation de multigraphe, tels que la capacité de représentation et l’efficacité de calcul.
Innovations: (1) Proposition de la représentation de multigraphe, résolvant pour la première fois le problème du multiplexage d’arguments; (2) MGREE est le premier modèle d’extraction d’événements de bout en bout basé sur la représentation de multigraphe; (3) Les expériences d’analyse valident les avantages de la représentation de multigraphe en termes de capacité de représentation et d’efficacité de calcul.
Cette recherche propose une nouvelle méthode de représentation d’événements par multigraphe, capable de résoudre efficacement le problème du multiplexage d’arguments, et conçoit un modèle d’extraction d’événements de bout en bout obtenant les meilleures performances sur des jeux de données publics, ayant ainsi une importance significative pour le développement de la tâche d’extraction d’événements.