Suivi des connaissances contrôlé par le flux de mémoire en trois étapes
Contexte académique
Avec le développement rapide des technologies d’intelligence artificielle (IA), les systèmes de tutorat intelligents (Intelligent Tutoring Systems, ITS) tels que Khan Academy et Coursera ont réalisé des progrès significatifs dans l’apprentissage personnalisé. Le suivi des connaissances (Knowledge Tracing, KT), en tant que technologie clé des ITS, vise à inférer la maîtrise des connaissances des étudiants en analysant leurs données d’apprentissage et à prédire leurs performances futures. Bien que des progrès notables aient été réalisés dans le domaine du KT ces dernières années, les modèles existants présentent des lacunes dans la modélisation de la structure de la mémoire, entraînant une incohérence entre l’apprentissage explicite des étudiants et la transformation implicite de la mémoire. Pour résoudre ce problème, une équipe de recherche de l’Université normale de Chine centrale, entre autres, a proposé un modèle de suivi des connaissances en trois étapes contrôlé par le flux de mémoire (Memory Flow-controlled Knowledge Tracing with Three Stages, MFcKT), visant à améliorer la précision et l’interprétabilité du suivi des connaissances en simulant les trois étapes de la mémoire (enregistrement de la mémoire sensorielle, encodage de la mémoire à court terme et récupération de la mémoire à long terme).
Source de l’article
Cette recherche a été menée conjointement par Huang Tao, Hu Junjie, Yang Huali et d’autres chercheurs de la Faculté d’intelligence artificielle en éducation de l’Université normale de Chine centrale. Elle a été publiée en 2025 dans la revue Neural Networks sous le titre Memory Flow-controlled Knowledge Tracing with Three Stages. Cette recherche a reçu le soutien de plusieurs institutions, notamment l’Université normale de Chine centrale, l’Université normale du Ningxia et l’Université de textile de Wuhan.
Processus de recherche
1. Définition du problème et base théorique
La recherche commence par définir la tâche de suivi des connaissances (KT), qui consiste à inférer l’état de connaissance potentiel des étudiants à partir de séquences de données d’apprentissage (comprenant des exercices, des concepts et des réponses) et à prédire leurs performances futures. Basée sur la théorie du traitement de l’information (Information Processing Theory), la recherche décompose le processus d’apprentissage en trois étapes de flux de mémoire : enregistrement de la mémoire sensorielle, encodage de la mémoire à court terme et récupération de la mémoire à long terme. Ces trois étapes correspondent à différents types de mémoire (mémoire sensorielle, mémoire à court terme et mémoire à long terme) et simulent l’évolution dynamique des connaissances à travers des mécanismes de transformation de la mémoire.
2. Conception du modèle
Le cœur du modèle MFcKT réside dans la simulation du flux de mémoire à travers trois étapes : - Enregistrement de la mémoire sensorielle (Sensory Memory Registration, SMR) : Utilisation de l’apprentissage contrastif (Contrastive Pre-training) et du mécanisme d’auto-attention (Self-attention) pour extraire la mémoire sensorielle des séquences d’apprentissage. - Fusion de la mémoire à court terme (Short-term Memory Fusion, SMF) : Fusion des caractéristiques relationnelles et temporelles de la mémoire sensorielle à travers une structure à double canal (comprenant un mécanisme d’attention et un réseau neuronal récurrent) pour générer la mémoire à court terme. - Récupération de la mémoire à long terme (Long-term Memory Retrieval, LMR) : Conception d’un mécanisme de verrouillage monotone (Monotonic Gating Mechanism) pour calculer les poids des états de mémoire cachés et effectuer des opérations de lecture et d’écriture sur la matrice de mémoire, combinant finalement les vecteurs de mémoire à long terme et à court terme pour récupérer l’état de connaissance potentiel.
3. Conception des expériences et ensembles de données
La recherche a mené des expériences approfondies sur cinq ensembles de données publics (ASSISTments2009, ASSISTments2015, ASSISTments2017, Algebra2005 et NIPS34) pour valider l’efficacité de MFcKT. Les ensembles de données couvrent les enregistrements d’apprentissage des étudiants sur différentes plateformes éducatives intelligentes, y compris des exercices, des concepts et des données de réponse.
4. Résultats des expériences
Les résultats expérimentaux montrent que MFcKT surpasse de manière significative les modèles de suivi des connaissances existants sur tous les ensembles de données. Par exemple, sur l’ensemble de données ASSISTments2009, l’AUC (Area Under Curve) de MFcKT atteint 0,8232, soit une amélioration de 1,18 % par rapport au meilleur modèle existant. De plus, MFcKT performe bien sur l’ensemble de données ASSISTments2015, qui manque d’informations sur les exercices, avec une amélioration de l’AUC de 3,48 %, démontrant l’avantage de sa structure à double canal dans la capture des caractéristiques relationnelles et temporelles.
5. Expériences d’ablation
Pour vérifier la contribution de chaque module, la recherche a mené des expériences d’ablation. Les résultats montrent que la suppression de tout module (SMR, SMF ou LMR) entraîne une diminution des performances du modèle, prouvant l’importance de la conception en trois étapes du flux de mémoire.
Principaux résultats et conclusions
1. Module d’enregistrement de la mémoire sensorielle
Grâce à l’apprentissage contrastif et au mécanisme d’auto-attention, MFcKT peut extraire efficacement la mémoire sensorielle et capturer les différences individuelles des étudiants. Les expériences montrent que ce module joue un rôle clé dans l’amélioration de la précision des prédictions du modèle.
2. Module de fusion de la mémoire à court terme
La structure à double canal (mécanisme d’attention et réseau neuronal récurrent) fusionne avec succès les caractéristiques relationnelles et temporelles de la mémoire sensorielle, générant une mémoire à court terme plus représentative. Cette conception améliore considérablement la capacité du modèle à modéliser le processus d’apprentissage.
3. Module de récupération de la mémoire à long terme
Le mécanisme de verrouillage monotone calcule les poids des états de mémoire cachés, permettant une gestion et une récupération efficaces de la mémoire à long terme. Les expériences montrent que ce module joue un rôle important dans l’amélioration de l’interprétabilité et des performances de prédiction du modèle.
4. Performance globale
La performance globale de MFcKT sur les cinq ensembles de données surpasse tous les modèles de référence, prouvant sa supériorité dans la tâche de suivi des connaissances. De plus, l’efficacité et la robustesse du modèle fournissent un soutien solide pour son application dans les systèmes éducatifs réels.
Points forts de la recherche
- Conception innovante du flux de mémoire : MFcKT introduit pour la première fois la théorie des trois étapes du flux de mémoire dans le domaine du suivi des connaissances, résolvant efficacement le problème d’incohérence dans la modélisation de la mémoire des modèles existants.
- Structure à double canal : En combinant un mécanisme d’attention et un réseau neuronal récurrent, MFcKT peut capturer simultanément les caractéristiques relationnelles et temporelles de la mémoire, améliorant les performances globales du modèle.
- Technique d’apprentissage contrastif : En utilisant l’apprentissage contrastif, MFcKT peut mieux simuler les différences individuelles des étudiants, renforçant la capacité d’apprentissage personnalisé du modèle.
- Validation expérimentale étendue : Les expériences sur plusieurs ensembles de données publics prouvent la supériorité et la robustesse de MFcKT, établissant une base solide pour sa promotion dans des applications réelles.
Signification et valeur de la recherche
La recherche sur MFcKT fournit non seulement un nouveau cadre théorique et des méthodes techniques pour le domaine du suivi des connaissances, mais offre également un soutien solide pour les services d’apprentissage personnalisé des systèmes éducatifs intelligents. En simulant les trois étapes du flux de mémoire, MFcKT peut suivre avec précision le processus d’évolution des connaissances des étudiants et leur fournir des recommandations de ressources d’apprentissage personnalisées et des retours instantanés. De plus, cette recherche ouvre de nouvelles voies pour des explorations futures dans le domaine de l’exploration de données éducatives et de l’intelligence artificielle.
Autres informations pertinentes
La recherche a également comparé les effets de différentes couches de fusion (fusion basée sur la similarité et fusion basée sur l’attention), montrant que la couche de fusion basée sur l’attention est plus avantageuse pour améliorer les performances du modèle. De plus, l’équipe de recherche a exploré l’efficacité de l’entraînement et de l’inférence du modèle, fournissant des références pour l’optimisation future des modèles.
La recherche sur MFcKT apporte une nouvelle percée dans le domaine du suivi des connaissances, sa conception innovante du flux de mémoire et sa structure à double canal efficace ouvrent de nouvelles possibilités pour le développement des systèmes éducatifs intelligents.