Contrôle de suivi de formation déclenché par événement basé sur observateur pour des systèmes multi-agents de second ordre dans une région contrainte
Résumé de l’étude sur le contrôle de suivi de formation à variation temporelle dans des régions contraintes pour systèmes multi-agents
Le contrôle coordonné et coopératif des systèmes multi-agents (Multi-Agent Systems, MAS) a suscité une attention croissante ces dernières années. Cet intérêt découle non seulement de leurs applications dans des domaines tels que les véhicules sous-marins autonomes et les véhicules aériens multicoptères, mais également de leur potentiel à améliorer l’efficacité de l’automatisation, à accomplir des tâches complexes et à réduire les pertes de ressources. Cependant, dans des environnements réels complexes et dynamiques, le contrôle de suivi de formation pour les systèmes multi-agents présente des exigences accrues, telles que la gestion des perturbations inconnues, l’évitement des collisions, et la réalisation de tâches dans des zones contraintes.
L’article intitulé Observer-based event-triggered formation tracking control for second-order multi-agent systems in constrained region propose de nouvelles solutions dans ce domaine de recherche. Cet article est le fruit d’une collaboration entre Fenglan Sun, Zhonghua Xu, Wei Zhu et Jürgen Kurths, affiliés respectivement à l’Université de Poste et Télécommunications de Chongqing (Chine), l’Institut Potsdam de Recherche sur l’Impact Climatique (Allemagne), et l’Université Humboldt de Berlin (Allemagne). Publiée dans le numéro de février 2025 de Science China Information Sciences, cette étude se concentre sur le contrôle basé sur des observateurs avec déclenchement événementiel pour des systèmes multi-agents non-linéaires de second ordre opérant dans des régions contraintes.
Contexte et motivations de l’étude
Les recherches traditionnelles sur le contrôle de formation des systèmes multi-agents se concentrent principalement sur des formations invariantes dans le temps. Bien que ces approches statiques soient efficaces dans certains scénarios spécifiques, elles s’avèrent inadéquates dans des applications réelles nécessitant des réponses dynamiques aux déplacements de la cible, à des environnements complexes et aux perturbations inconnues. Pour garantir la sécurité des systèmes, il est nécessaire de prendre en compte à la fois l’évitement des collisions entre agents et l’évitement des collisions avec les obstacles environnementaux. De plus, en raison des limitations des ressources de communication et d’énergie, il devient crucial de réduire les coûts de communication dans les systèmes multi-agents, tout en maintenant des mises à jour efficaces des contrôleurs.
Méthodologie et déroulement de la recherche
Pour relever ces défis, cet article propose une méthode complète de contrôle de formation à variation temporelle basée sur des observateurs, en intégrant des mécanismes d’évitement de collisions basés sur le champ de potentiel artificiel (Artificial Potential Field, APF) et une stratégie de déclenchement événementiel basée sur le contrôle par modes glissants. Voici les étapes spécifiques du cadre proposé :
1. Conception d’un observateur de perturbations inconnues externes
En raison de l’influence fréquente des perturbations inconnues dans les systèmes réels, l’article propose un nouvel observateur de perturbations garantissant un haut niveau de performance pour estimer précisément les perturbations externes inconnues. L’innovation réside dans l’introduction d’une variable auxiliaire renforçant l’analyse de la stabilité de l’observateur, tout en appliquant des équations différentielles et des modes glissants pour optimiser les performances estimatives. L’observateur est défini par l’expression suivante :
$$ \hat{d}_i(t) = c_1 \Delta_i + c_2 \text{sign}(\Delta_i) + \xi_i(t) $$
où ( c_1, c_2, c_3, c_4 ) sont des coefficients d’ajustement des performances de l’observateur, et (\Delta_i) est l’incrément de vitesse.
2. Élaboration d’une stratégie d’évitement de collisions basée sur les champs potentiels
Pour éviter les collisions, l’étude a introduit une méthode basée sur le champ de potentiel artificiel, et suppose que chaque agent possède une structure rigide. Des forces répulsives virtuelles sont générées par un gradient négatif des fonctions de potentiel, assurant ainsi une distance minimale sécurisée entre les agents ou entre un agent et un obstacle. L’expression mathématique s’écrit comme suit :
$$ \gammai(t) = - \sum{χ=1}^{n} \nabla_{xi}ψ^c{iχ}(d) - \sum{χ=1}^{k} \nabla{xi}ψ^o{iχ}(d) $$
où ( ψ^c(x), ψ^o(x) ) sont des fonctions de potentiel répulsif basées sur la distance et la vitesse assurant la gestion de la distance sécuritaire minimale.
3. Développement d’une condition de déclenchement événementiel
Pour minimiser la fréquence de mise à jour des contrôleurs et réduire la consommation des communications, une stratégie de déclenchement événementiel a été adoptée. Cette stratégie repose sur une fonction de coût (y), ainsi définie :
$$ y = |ζ_1| \cdot |e_1| + |ζ_2| \cdot |e_2| + |ζ_3| \cdot |e_3| + |\l̄ + e_4| + e_5 $$
où (e_1, e_2, e_3) représentent les termes d’erreur du gradient.
4. Conception d’un contrôleur de suivi de formation
Un contrôleur de suivi de formation basé sur les modes glissants a été conçu, respectant le mécanisme de déclenchement événementiel. L’expression du contrôleur s’écrit comme suit :
$$ u_i(t) = g_i^+(formule globale de contrôle) $$
Le contrôleur garantit non seulement la génération de la formation cible, mais assure aussi l’évitement des collisions et la navigation dans des zones contraintes.
Expériences et résultats
1. Paramétrage de l’expérience de simulation
Cet article a validé son approche par une simulation impliquant six agents : un leader virtuel et cinq suiveurs. L’objectif était de constituer et maintenir une formation géométrique pentagonale dans une région contrainte ((\omega_1)) tout en évitant des obstacles environnementaux. La région contrainte est définie comme suit :
$$ \omega_1 := {(x, y)|x-y+8>0, x+y-8 \leq 0, x-y-8 \leq 0, x+y+8>0}. $$
2. Résultats et analyse
Formation et validation de l’évitement des obstacles
Les résultats montrent que tous les agents accèdent avec succès à la région (\omega_1) et forment la structure pentagonale cible. Les trajets indiquent clairement une adaptation pour éviter les collisions, ce qui valide l’efficacité de la méthode APF (voir Figure 3 et Figure 4).Performance de l’observateur de perturbations
Comme montré à la Figure 5, l’erreur d’estimation des perturbations externes converge rapidement vers zéro, indiquant une estimée précise par l’observateur proposé.Suivi de formation et déclenchement sans comportement zéno
Les Figures 6 et 7 démontrent que les courbes de position et de vitesse suivent fidèlement les trajectoires cibles, tandis que la Figure 8 confirme une absence de comportement zéno, prouvant ainsi l’efficacité du déclenchement événementiel.Changement de région dynamique
L’étude traite également les transitions dynamiques entre régions contraintes multiples (par ex. (\omega_2) et (\omega_1)), montrant des trajectoires fluides et continues (voir Figures 11 et 12).
Contributions et significations de l’étude
Traitement d’un problème intégratif complexe
L’article intègre des problématiques avancées telles que perturbations inconnues, dynamiques non-linéaires et évitement des collisions dans un cadre unifié, avec une prise en compte explicite des contraintes de région.Conception d’un observateur innovant
L’introduction de variables auxiliaires renforce la stabilité et l’applicabilité des observateurs, offrant un potentiel de généralisation vers d’autres systèmes dynamiques.Méthodes applicables sur le terrain
L’algorithme proposé est pertinent pour des applications telles que les vols de drones coordonnés et la navigation des robots sous-marins.Réponse aux problématiques multi-régions
En traitant les transitions complexes entre régions contraintes, cet article ouvre de nouvelles voies pour le contrôle des systèmes multi-agents en environnements dynamiques.
Perspectives futures
L’approche présentée représente une avancée importante dans le contrôle de formation des systèmes multi-agents. Les travaux futurs devraient explorer des stratégies accélérant davantage la convergence (par ex. contrôle en temps fixe) ainsi que des applications dans des régions entièrement non convexes. Cette recherche constitue une base solide pour le développement de systèmes intelligents de prochaine génération.