Modèle efficace de réseaux de neurones probabilistes pour l'apprentissage par renforcement basé sur modèle dans les USV

Nouvelle méthode de contrôle prédictif pour les véhicules de surface sans pilote (USV) : Cadre MBRL basé sur les réseaux de neurones probabilistes Contexte académique Les véhicules de surface sans pilote (Unmanned Surface Vehicles, USV) ont connu un développement rapide ces dernières années dans le domaine des sciences marines, étant largement util...

Apprentissage sans modèle interne versus apprentissage avec récompenses externes dans des environnements à information limitée

Analyse d’une publication scientifique : Comparaison entre apprentissage sans modèle propre et apprentissage avec récompenses externes dans des environnements à contraintes d’information Contexte & Motivation Les systèmes cyber-physiques (Cyber-Physical Systems, CPS) sont largement utilisés dans des domaines clés tels que les véhicules autonomes, l...

Contrôle optimal des systèmes de saut markovien stochastiques avec bruits de Wiener et de Poisson : deux approches d'apprentissage par renforcement

Contrôle optimal des systèmes stochastiques à saut marovien avec des bruits de Wiener et de Poisson : deux méthodes d’apprentissage par renforcement Contexte académique Dans la théorie moderne du contrôle, le contrôle optimal est un domaine de recherche essentiel, avec pour objectif de concevoir une stratégie de contrôle optimale qui minimise une f...