Combattre le bruit des étiquettes avec un modèle de substitution général pour la sélection des échantillons

Contexte académique et problématique Avec le développement rapide des réseaux de neurones profonds (Deep Neural Networks, DNNs), les systèmes d’intelligence visuelle ont réalisé des progrès significatifs dans des tâches telles que la classification d’images, la détection d’objets et la compréhension vidéo. Cependant, ces avancées dépendent de la co...

Exploration des associations d'étiquettes cohérentes homogènes et hétérogènes pour la ré-identification non supervisée des personnes en lumière visible et infrarouge

Exploration des associations de labels homogènes et hétérogènes cohérentes pour la ré-identification non supervisée de personnes en visible-infrarouge Introduction La ré-identification de personnes en visible-infrarouge (Visible-Infrared Person Re-Identification, VI-ReID) est un domaine de recherche important en vision par ordinateur, visant à retr...

Aniclipart : Animation de Clipart avec des A Priori Texte-Vidéo

Contexte académique et problématique Le Clipart (image clipart) est une forme d’art graphique prédéfinie largement utilisée dans les documents, les présentations et les sites web pour améliorer rapidement l’attrait visuel. Cependant, les workflows traditionnels pour convertir des images clipart statiques en séquences animées sont laborieux et chron...

LaVie : Génération de vidéos de haute qualité avec des modèles de diffusion latente en cascade

LaVie : Génération de vidéos de haute qualité avec des modèles de diffusion latente en cascade

Génération de vidéos de haute qualité avec des modèles de diffusion latente en cascade : LaVie Contexte académique Ces dernières années, les modèles de diffusion (Diffusion Models, DMs) ont réalisé des avancées révolutionnaires dans le domaine de la génération d’images, en particulier pour la génération d’images à partir de texte (Text-to-Image, T2...

SLIDE : Un cadre unifié de génération de maillage et de texture avec un contrôle géométrique amélioré et une cohérence multi-vues

SLIDE : Un cadre unifié de génération de maillage et de texture avec un contrôle géométrique amélioré et une cohérence multi-vues

Rapport sur un article académique Contexte académique Avec l’augmentation de la demande en contenu 3D de haute qualité dans des industries telles que les jeux, l’architecture et les médias sociaux, le processus manuel de création d’actifs 3D est non seulement chronophage et techniquement complexe, mais aussi coûteux. En particulier dans l’industrie...

De la Comportement au Langage Naturel : Approche Générative pour la Reconnaissance des Intentions des UAV

Basé sur un modèle génératif pour la reconnaissance d’intention de drone : Recherche intermodale du comportement à la langue naturelle Contexte et Objectifs de l’Étude Ces dernières années, la technologie des drones (Unmanned Aerial Vehicle, UAV) a connu une expansion rapide, avec des applications dans les domaines civils et militaires tels que les...

Q-Cogni : Un cadre intégré d'apprentissage par renforcement causal

Rapport de dynamique scientifique : Q-Cogni — Un cadre intégré d’apprentissage par renforcement causal Ces dernières années, les avancées rapides de l’intelligence artificielle (IA) ont conduit les chercheurs à explorer en profondeur la construction de systèmes d’apprentissage par renforcement (Reinforcement Learning, RL) plus efficaces et explicab...

Epi-Curriculum : Apprentissage curriculaire épisodique pour l'adaptation de domaine à faible ressource en traduction automatique neuronale

Epi-Curriculum : Apprentissage Curriculaire Épisodique pour l’Adaptation de Domaine à Faibles Ressources Contexte de la Recherche et Énoncé du Problème Ces dernières années, la traduction automatique neuronale (Neural Machine Translation, NMT) est devenue une référence dans le domaine de la technologie du traitement du langage naturel. Toutefois, b...

Amélioration de la détection d'objets aériens avec un réseau d'interaction de fréquence sélective

Amélioration de la Détection d’Objets Aériens avec le Réseau d’Interaction Sélective de Domaine Fréquentiel Contexte de l’Étude et Problèmes Posés Avec l’évolution des technologies de vision par ordinateur, la détection d’objets aériens est devenue un domaine de recherche essentiel en télédétection. Ce processus vise à identifier des cibles telles ...

RADIFF : Modèles de diffusion contrôlables pour la génération de cartes astronomiques radio

RaDiff : Des modèles de diffusion contrôlables pour la génération de cartes astronomiques radio Introduction Avec l’achèvement imminent du Square Kilometer Array (SKA), le domaine de la radioastronomie s’apprête à connaître des avancées révolutionnaires dans l’exploration de l’univers. Le SKA, par ses niveaux sans précédent de sensibilité et de rés...