Contrôle artificiel-Actuel à échantillonnage adaptatif pour des systèmes contraints de jeux non à somme nulle

Application du contrôle artificiel-actual adaptatif dans des jeux non-zéro somme de systèmes contraints

Contexte

Dans les domaines industriels et de recherche modernes, le développement rapide des technologies intelligentes et des systèmes de contrôle rend les méthodes de contrôle traditionnelles insuffisantes pour garantir la stabilité des systèmes et minimiser la consommation d’énergie. Les systèmes réels sont généralement très complexes, impliquant au moins deux unités de contrôle, avec des relationships complexes de compétition et de coopération entre les composants. Dans ce contexte, la conception d’un schéma de contrôle doit non seulement maximiser les bénéfices de chaque contrôleur individuel, mais aussi optimiser globalement le système. Ces problèmes sont souvent considérés comme des jeux non-zéro somme (Non-Zero-Sum Games, NZSG), et traiter la dynamique couplée des systèmes sous contraintes multi-entrées est un défi de recherche majeur.

Source de la recherche

Cet article, intitulé «Adaptive Sampling Artificial-Actual Control for Non-Zero-Sum Games of Constrained Systems», est réalisé par Lu Liu et Ruizhuo Song, tous deux affiliés au Centre de Recherche en Imagerie Spectrale Industrielle de l’École d’automatisation et d’ingénierie électronique de l’Université des Sciences et Technologies de Pékin. L’article sera publié en 2024 dans la revue «Neural Networks». Les dates de réception et de révision de l’article sont respectivement le 7 novembre 2023 et le 21 avril 2024, et il a été accepté définitivement le 27 mai 2024.

Contenu de la recherche

Cet article propose un schéma de programmation dynamique adaptatif (Adaptive Dynamic Programming, ADP) utilisant l’interaction entre systèmes artificiels et réels pour optimiser les stratégies de contrôle face aux problèmes de jeux non-zéro somme sous contraintes d’entrée. Le cœur de cette recherche est de traiter le contrôle efficace des systèmes non linéaires multi-entrées par la conception de fonctions de coût et l’approximation de la solution d’équilibre de Nash des NZSG.

Contrôle Artificiel-Réel et ADP

La recherche utilise un réseau de neurones dynamique Elman amélioré (Elman Dynamic Neural Networks, EDNNs) pour construire des systèmes artificiels. En ajustant les paramètres de manière adaptative, les EDNNs approchent progressivement le comportement dynamique des systèmes réels, rendant le contrôle plus efficace. Ce système artificiel apprend et ajuste en continu les paramètres, interagissant avec le système physique pour prévoir l’état du système.

Les étapes spécifiques sont les suivantes : 1. Construction du système artificiel : Utiliser un réseau de neurones Elman amélioré comprenant une couche d’entrée, couche cachée, couche responsable et couche de sortie. Grâce à la régularisation par Dropout pour éviter le sur-apprentissage, chaque neurone caché omet aléatoirement une certaine proportion des valeurs d’activation, augmentant les performances du réseau. 2. Construction de la structure critique-acteur : Utiliser une approximation polynomiale pour les fonctions de valeur et les stratégies de contrôle. Par la méthode de la descente de gradient, les paramètres de poids sont continuellement mis à jour pour minimiser l’erreur. 3. Introduction de trois mécanismes de déclenchement : Mécanisme de déclenchement d’événements (Event-triggered Mechanism, ETM), mécanisme de déclenchement d’événements dynamique (Dynamic Event-triggered Mechanism, DETM) et mécanisme de déclenchement autonome (Self-triggered Mechanism, STM). Ces mécanismes optimisent respectivement l’efficacité de la communication et la stabilité du système de différentes manières.

Expérimentation et résultats

Pour vérifier le schéma de contrôle conçu, la recherche simule une expérience sur un système de manipulateur à deux liens avec des entrées contraint. Le processus de contrôle du système est divisé en plusieurs étapes :

  1. Modélisation de l’état du système : Définir un modèle d’état de système incorporant la position et la vitesse.
  2. Simulation de la stratégie de contrôle : Comparer les stratégies de contrôle sous les mécanismes ETM, DETM et STM, en appliquant des contraintes spécifiques sur les signaux d’entrée du contrôleur.
  3. Analyse des données : En ajustant différents seuils de déclenchement, enregistrer le nombre de déclenchements, le taux de déclenchement, et les changements d’état du système.

Résultats spécifiques

  1. Mécanisme de déclenchement d’événements (ETM) :

    • Économie de ressources de communication, réduction des mises à jour inutiles, très efficace.
    • Apparition de changements en escaliers dans le système, la stratégie de contrôle fait converger efficacement l’état du système vers un point d’équilibre.
    • Évite le phénomène Zeno, maintient la stabilité du système.
  2. Mécanisme de déclenchement d’événements dynamique (DETM) :

    • Introduction de variables dynamiques, réduction supplémentaire du volume de communication, amélioration de l’efficacité de l’échantillonnage.
    • Ajustement dynamique des intervalles de déclenchement dans la stratégie de contrôle, augmentation de l’efficacité d’apprentissage du système.
    • Les expériences montrent que le DETM maintient toujours la stabilité du système, avec une meilleure utilisation des ressources.
  3. Mécanisme de déclenchement autonome (STM) :

    • Capacité de réponse proactive, ne dépend pas du matériel de surveillance externe.
    • Prédiction interne du prochain point de déclenchement, amélioration de la capacité de prévision du système et de sa proactivité.
    • Les résultats expérimentaux montrent que le STM peut gérer efficacement les ressources de communication et éviter les retards de déclenchement.

Conclusion et signification

Cette recherche, en construisant un schéma ADP et en optimisant l’interaction entre systèmes artificiels et réels, a réussi à résoudre le problème de contrôle des jeux non-zéro somme sous des conditions de contraintes multi-entrées. L’optimisation de la communication des données a réduit la charge de calcul et de communication du système, améliorant ainsi l’efficacité et la stabilité globale du contrôle du système. Les résultats de cette recherche enrichissent non seulement théoriquement les méthodes de recherche en contrôle automatique, mais fournissent également des solutions pratiquement réalisables pour les applications d’ingénierie réelles.

Points forts

  1. Mécanisme innovant de contrôle artificiel-réel : L’utilisation des EDNNs permet une prédiction d’état du système de haute précision, améliorant les effets de contrôle.
  2. Trois mécanismes de déclenchement adaptatif : Réduction efficace du volume des transmissions de données, optimisation des performances du système, avec une grande utilité pratique en ingénierie.
  3. Perspectives d’application : Les résultats de cette recherche ont une valeur d’application importante dans des domaines comme les systèmes robotiques, les systèmes de contrôle intelligent, et sont particulièrement adaptés aux systèmes complexes nécessitant une fiabilité élevée et avec des ressources limitées.

Ci-dessus représente une couverture complète et une interprétation de l’article «Adaptive Sampling Artificial-Actual Control for Non-Zero-Sum Games of Constrained Systems». Cette recherche propose des solutions innovantes pour les systèmes de contrôle complexes multi-entrées grâce à la programmation dynamique adaptative et au design de plusieurs mécanismes de déclenchement.