Apprentissage Actif Bayésien Profond Utilisant le Matériel de Calcul en Mémoire
Avec le développement rapide de la technologie de l’intelligence artificielle (IA), l’apprentissage profond a réalisé des progrès significatifs dans des tâches complexes. Cependant, le succès de l’apprentissage profond dépend largement de grandes quantités de données annotées, et le processus d’annotation des données est non seulement chronophage et laborieux, mais nécessite également des connaissances spécialisées dans le domaine, ce qui entraîne des coûts élevés. En particulier dans certains domaines spécialisés, tels que l’apprentissage des compétences des robots, la découverte de catalyseurs, la découverte de médicaments et l’optimisation de la production de protéines, la difficulté et le coût d’obtention de données annotées sont particulièrement importants. Pour résoudre ce problème, l’apprentissage actif bayésien profond (Deep Bayesian Active Learning, DBAL) est apparu. Le DBAL améliore considérablement l’efficacité de l’annotation en sélectionnant activement les données les plus informatives pour l’annotation, permettant ainsi un apprentissage de haute qualité avec un nombre limité de données annotées.
Cependant, la mise en œuvre du DBAL fait face à un défi technique majeur : il nécessite de traiter un grand nombre de variables aléatoires et des transferts de données à haute bande passante, ce qui impose des exigences très élevées sur le matériel traditionnel déterministe. Le matériel traditionnel à base de semi-conducteurs complémentaires à oxyde métallique (Complementary Metal-Oxide-Semiconductor, CMOS) entraîne souvent des consommations d’énergie et des délais importants lorsqu’il traite ces tâches aléatoires. Par conséquent, l’équipe de recherche a proposé un cadre de calcul en mémoire (Computation-in-Memory, CIM) basé sur les mémristors (Memristor), en utilisant les propriétés aléatoires intrinsèques des mémristors pour réaliser un DBAL efficace.
Cette recherche a été menée conjointement par Yudeng Lin, Bin Gao, Jianshi Tang, Qingtian Zhang, He Qian et Huaqiang Wu, chercheurs à la School of Integrated Circuits de Tsinghua University et au Beijing National Research Center for Information Science and Technology. Les résultats de l’étude ont été publiés en janvier 2025 dans la revue Nature Computational Science.
Contexte et problématique de la recherche
Le succès de l’apprentissage profond dépend de grandes quantités de données annotées, mais dans de nombreux scénarios pratiques, l’obtention de ces données est non seulement coûteuse, mais nécessite également beaucoup de temps et d’expertise. Par exemple, dans l’apprentissage des compétences des robots, les robots doivent essayer et ajuster leurs actions à plusieurs reprises pour apprendre à exécuter des tâches spécifiques, et chaque essai nécessite de réinitialiser le scénario expérimental, ce qui augmente considérablement les coûts en temps et en ressources. Le DBAL améliore considérablement l’efficacité de l’annotation en sélectionnant activement les données les plus informatives pour l’annotation, réduisant ainsi la quantité de données annotées nécessaires et diminuant les coûts.
Cependant, la mise en œuvre du DBAL fait face à des défis matériels. Le DBAL implique un grand nombre de variables aléatoires et des transferts de données à haute bande passante, et le matériel CMOS traditionnel entraîne souvent des consommations d’énergie et des délais importants lorsqu’il traite ces tâches. De plus, le DBAL nécessite également la génération d’un grand nombre de nombres aléatoires gaussiens, une tâche intensive en calcul qui augmente encore la charge sur le matériel.
Méthodes de recherche et innovations
Pour résoudre ces problèmes, l’équipe de recherche a proposé un cadre CIM basé sur les mémristors. Les mémristors sont de nouveaux dispositifs de mémoire non volatiles dont la conductivité peut être modulée par une tension appliquée, et ils possèdent des propriétés aléatoires intrinsèques. En utilisant ces propriétés, les mémristors peuvent générer efficacement des nombres aléatoires et effectuer des calculs parallèles, réduisant ainsi considérablement les délais et la consommation d’énergie liés au transfert de données.
Plus précisément, l’équipe de recherche a proposé une méthode de dynamique de Langevin à gradient stochastique basée sur les mémristors (Memristor Stochastic Gradient Langevin Dynamics, MSGLD), exploitant les propriétés de modulation aléatoire des mémristors pour implémenter le DBAL dans le cadre CIM. Pour valider la faisabilité et l’efficacité de cette méthode, l’équipe de recherche a mis en œuvre le DBAL sur un système CIM stochastique basé sur les mémristors et a démontré avec succès une tâche d’apprentissage de compétences robotiques. Les résultats expérimentaux montrent que, par rapport au matériel CMOS traditionnel, le système CIM basé sur les mémristors a amélioré la vitesse de 44 % et économisé 153 fois plus d’énergie.
Résultats et conclusions de la recherche
L’équipe de recherche a d’abord analysé les propriétés aléatoires des mémristors, constatant que les mémristors présentent des fluctuations aléatoires de distribution gaussienne lors des processus de lecture et de modulation, fournissant une base pour la génération efficace de nombres aléatoires. Ensuite, ils ont proposé la méthode MSGLD, exploitant les propriétés aléatoires des mémristors pour réaliser une mise à jour efficace des poids du réseau. Grâce à cette méthode, le réseau de neurones bayésien profond (BDNN) basé sur les mémristors peut apprendre efficacement à partir d’échantillons incertains et capturer avec précision l’incertitude dans les prédictions.
Dans les expériences d’apprentissage des compétences robotiques, l’équipe de recherche a utilisé un BDNN à mémristors de taille 11×50×50×2 et, grâce à la méthode DBAL, a réussi à entraîner un robot pour apprendre la compétence de versement d’eau. Les résultats expérimentaux montrent que, par rapport à la méthode d’apprentissage passive, la méthode d’apprentissage active a considérablement amélioré les performances de classification du modèle et le taux de réussite de la tâche avec la même quantité de données annotées. De plus, le système CIM basé sur les mémristors a démontré une efficacité énergétique et une vitesse élevées dans le traitement de ces tâches, prouvant le grand potentiel de ce système dans des applications telles que l’apprentissage des compétences robotiques.
Valeur et signification de la recherche
Cette étude propose un cadre CIM basé sur les mémristors, combiné à la méthode MSGLD, pour réaliser un DBAL efficace. Cette innovation réduit considérablement les coûts et le temps associés à l’annotation des données et offre une méthode d’apprentissage efficace pour des scénarios à ressources limitées, tels que le calcul en périphérie. De plus, les propriétés aléatoires intrinsèques des mémristors offrent une nouvelle voie de mise en œuvre matérielle pour les calculs probabilistes dans les méthodes bayésiennes, ce qui ouvre des perspectives d’application vastes.
Les recherches futures pourraient explorer davantage le potentiel de la technologie des mémristors dans des scénarios d’application plus larges, tels que la découverte de médicaments, la conception de catalyseurs et l’optimisation de la production de protéines. De plus, l’optimisation des conditions de fabrication et d’exploitation des mémristors pour réduire les variations entre les dispositifs est également une direction importante pour les recherches futures.
Cette étude ouvre de nouvelles voies pour la mise en œuvre efficace de l’apprentissage profond et démontre le potentiel énorme de la technologie des mémristors dans le domaine de l’intelligence artificielle.