Modèle d'évaluation basé sur l'apprentissage profond pour l'identification en temps réel des apprenants visuels utilisant l'EEG brut

Dans l’environnement éducatif actuel, comprendre le style d’apprentissage des étudiants est crucial pour améliorer leur efficacité d’apprentissage. En particulier, l’identification des styles d’apprentissage visuels (visual learning style) aide les enseignants et les étudiants à adopter des stratégies plus efficaces dans le processus d’enseignement et d’apprentissage. Actuellement, l’identification automatique du style d’apprentissage visuel repose principalement sur l’électroencéphalogramme (EEG) et les techniques de machine learning. Cependant, ces techniques nécessitent généralement un traitement hors ligne pour éliminer les artéfacts et extraire les caractéristiques, ce qui limite leur applicabilité dans les applications en temps réel.

Cette étude, menée par Soyiba Jawed, Ibrahima Faye et Aamir Saeed Malik, publiée dans l’IEEE Transactions on Neural Systems and Rehabilitation Engineering en 2024, propose un modèle en temps réel d’identification des apprenants visuels basé sur la technologie de l’apprentissage profond, visant à surmonter les limitations des méthodes traditionnelles.

Contexte de l’étude

Pourquoi réaliser cette étude ?

Le style d’apprentissage joue un rôle crucial dans le processus d’acquisition des compétences et des connaissances. Par conséquent, identifier et comprendre le style d’apprentissage est une étape importante pour optimiser les méthodes pédagogiques. Actuellement, des systèmes assistés par ordinateur peuvent utiliser l’EEG combiné à des algorithmes de machine learning pour évaluer le style d’apprentissage. Cependant, ces systèmes reposent principalement sur l’extraction et le traitement des caractéristiques hors ligne, ne pouvant pas répondre aux besoins de rétroaction en temps réel.

Connaissances de base pertinentes

Les styles d’apprentissage sont généralement classés en quatre catégories : visuel, kinesthésique, auditif et tactile. Selon les statistiques, environ 70 % des étudiants sont des apprenants visuels, apprenant par des effets visuels tels que des images, des vidéos et des présentations. De plus, les styles d’apprentissage sont liés à la dynamique neuronale du cerveau, donc l’étude de l’électroencéphalogramme (EEG) peut fournir une base objective pour l’identification des styles d’apprentissage.

Source de l’article

Cet article a été rédigé par les auteurs suivants :

  • Soyiba Jawed, affiliée à la Faculté des technologies de l’information de l’Université technique de Brno en République tchèque et au Département d’ingénierie informatique et logicielle de la Faculté de génie électrique et électrique de l’Université nationale des sciences et technologies à Islamabad, Pakistan.
  • Ibrahima Faye, affilié au Département des sciences fondamentales et appliquées de l’Universiti Teknologi Petronas en Malaisie.
  • Aamir Saeed Malik, affilié à la Faculté des technologies de l’information de l’Université technique de Brno, Département des systèmes informatiques.

Cette recherche a été publiée en 2024 dans l’IEEE Transactions on Neural Systems and Rehabilitation Engineering. L’étude a été financée par des projets de la Fondation tchèque des sciences, et toutes les procédures éthiques et expérimentales ont été approuvées par le Comité d’éthique de la recherche humaine de l’Universiti Teknologi Petronas et de l’Universiti Sains Malaisie.

Méthodologie de l’étude

Collecte des données et sujets

L’étude a sélectionné 34 sujets sains, dont les signaux EEG ont été mesurés au repos (les yeux ouverts et fermés) et lors de l’exécution de tâches d’apprentissage. Les sujets étaient âgés de 18 à 30 ans, avec une moyenne d’âge de 23,17 ans ± 3,04 ans. Tous les sujets avaient une vision normale ou corrigée à la normale, sans maladies neurologiques ni troubles de l’audition, et ne prenaient aucun médicament.

Tâches expérimentales

Les sujets devaient réaliser deux tâches principales : une tâche d’apprentissage et une tâche de mémorisation.

  1. Tâche d’apprentissage : comprenant 8 à 10 minutes de contenu animé sur l’anatomie humaine, sans aucune connaissance préalable des sujets sur ce contenu.
  2. Tâche de mémorisation : comprenant 20 questions à choix multiple liées au contenu appris, chaque question disposant de 30 secondes pour y répondre.

Enregistrement de l’EEG et traitement des données

Les signaux EEG ont été enregistrés en continu par un appareil EGI EEG, utilisant un réseau de capteurs hydrocel géodésique à 128 canaux. Le signal a été amplifié et échantillonné à une fréquence de 250 Hz.

Algorithme d’apprentissage profond

L’étude a utilisé trois techniques d’apprentissage profond pour la classification : les réseaux longue mémoire (LSTM), les réseaux de neurones convolutifs (CNN) et les réseaux de neurones convolutifs complets (FCNN). Le processus spécifique est le suivant :

  1. Modèle LSTM : conçu pour traiter les données séquentielles, capable de capturer les dépendances longues dans les séries temporelles.
  2. Modèle LSTM-CNN : combinant la capacité d’extraction de caractéristiques temporelles du LSTM et la capacité d’extraction de caractéristiques locales du CNN, réalisant ainsi une précision de classification plus élevée.
  3. Modèle LSTM-FCNN : un réseau convolutif complet succédant une couche LSTM, permettant de mieux extraire et classer les caractéristiques.

Division du jeu de données

Le jeu de données a été divisé en ensembles d’entraînement, de validation et de test. Durant l’entraînement, les paramètres du réseau ont été optimisés à l’aide de l’optimiseur ADAM, et la stratégie d’arrêt anticipé a été utilisée pour éviter le sur-apprentissage et le sous-apprentissage.

Résultats principaux de l’étude

Évaluation des performances du modèle

  • Modèle LSTM : précision moyenne de 96 %, sensibilité de 90 %, spécificité de 95 %.
  • Modèle LSTM-CNN : précision moyenne de 94 %, sensibilité de 80 %, spécificité de 92 %, score F1 de 94 %.
  • Modèle LSTM-FCNN : précision moyenne de 89 %, sensibilité de 84 %, spécificité de 90 %.

Analyse et comparaison des résultats

Les résultats montrent que les modèles LSTM et LSTM-CNN ont une précision de classification similaire, mais LSTM-CNN a un temps de calcul plus court pour les applications en temps réel, ce qui le rend plus adapté aux applications en temps réel. En comparaison avec les méthodes traditionnelles basées sur l’extraction manuelle de caractéristiques, les méthodes d’apprentissage profond améliorent significativement la précision de classification et ne nécessitent pas de prétraitement fastidieux.

Conclusion

Importance et valeur de l’étude

Cette étude a démontré l’efficacité de la technologie d’apprentissage profond basée sur les données brutes d’EEG pour l’identification en temps réel des apprenants visuels. Comparées aux méthodes traditionnelles de machine learning, les techniques d’apprentissage profond offrent non seulement une meilleure précision de classification, mais permettent également un traitement en temps réel, augmentant grandement l’efficacité de l’enseignement et de l’apprentissage.

Points forts de l’étude

  1. Reconnaissance en temps réel à haute précision : le modèle optimisé LSTM-CNN atteint une précision de classification de 94 %.
  2. Pas de besoin de traitement hors ligne : les données brutes EEG sont directement entrées dans le modèle, sans nécessiter d’extraction manuelle de caractéristiques ou de prétraitement, ce qui le rend adapté aux applications pratiques.
  3. Méthode d’apprentissage profond innovante : le modèle proposé combine les avantages du LSTM et du CNN, capturant des caractéristiques plus complexes dans les signaux EEG.

Directions futures de recherche

Bien que l’étude ait obtenu des résultats notables, des recherches supplémentaires sont nécessaires pour améliorer la capacité de généralisation du modèle et explorer son potentiel d’application dans l’identification d’autres styles d’apprentissage. Cette étude fournit une nouvelle méthode basée sur l’apprentissage profond dans le domaine de l’éducation, permettant d’identifier en temps réel et avec précision les apprenants visuels, offrant une valeur scientifique significative et une utilité pratique.