Sciences de l'information-Discipline-FmRead Avant-garde Académique

Champ de distance signée régularisé par des pseudo-plans pour la reconstruction neuronale de scènes intérieures Contexte académique La reconstruction tridimensionnelle (3D) de scènes intérieures est une tâche importante en vision par ordinateur, avec des applications prometteuses dans des domaines tels que l’infographie et la réalité virtuelle. Les...

AutoStory : Génération d'images narratives diversifiées avec un effort humain minimal

Contexte académique et problématique La visualisation d’histoires (Story Visualization) est une tâche visant à générer une série d’images visuellement cohérentes à partir d’une histoire décrite par un texte. Cette tâche exige que les images générées soient de haute qualité, alignées avec la description textuelle, et que les identités des personnage...

Contexte académique et problématique Avec le développement rapide des réseaux de neurones profonds (Deep Neural Networks, DNNs), les systèmes d’intelligence visuelle ont réalisé des progrès significatifs dans des tâches telles que la classification d’images, la détection d’objets et la compréhension vidéo. Cependant, ces avancées dépendent de la co...

Exploration des associations de labels homogènes et hétérogènes cohérentes pour la ré-identification non supervisée de personnes en visible-infrarouge Introduction La ré-identification de personnes en visible-infrarouge (Visible-Infrared Person Re-Identification, VI-ReID) est un domaine de recherche important en vision par ordinateur, visant à retr...

Contexte académique et problématique Le Clipart (image clipart) est une forme d’art graphique prédéfinie largement utilisée dans les documents, les présentations et les sites web pour améliorer rapidement l’attrait visuel. Cependant, les workflows traditionnels pour convertir des images clipart statiques en séquences animées sont laborieux et chron...

LaVie : Génération de vidéos de haute qualité avec des modèles de diffusion latente en cascade

Génération de vidéos de haute qualité avec des modèles de diffusion latente en cascade : LaVie Contexte académique Ces dernières années, les modèles de diffusion (Diffusion Models, DMs) ont réalisé des avancées révolutionnaires dans le domaine de la génération d’images, en particulier pour la génération d’images à partir de texte (Text-to-Image, T2...

SLIDE : Un cadre unifié de génération de maillage et de texture avec un contrôle géométrique amélioré et une cohérence multi-vues

Rapport sur un article académique Contexte académique Avec l’augmentation de la demande en contenu 3D de haute qualité dans des industries telles que les jeux, l’architecture et les médias sociaux, le processus manuel de création d’actifs 3D est non seulement chronophage et techniquement complexe, mais aussi coûteux. En particulier dans l’industrie...

Basé sur un modèle génératif pour la reconnaissance d’intention de drone : Recherche intermodale du comportement à la langue naturelle Contexte et Objectifs de l’Étude Ces dernières années, la technologie des drones (Unmanned Aerial Vehicle, UAV) a connu une expansion rapide, avec des applications dans les domaines civils et militaires tels que les...

Rapport de dynamique scientifique : Q-Cogni — Un cadre intégré d’apprentissage par renforcement causal Ces dernières années, les avancées rapides de l’intelligence artificielle (IA) ont conduit les chercheurs à explorer en profondeur la construction de systèmes d’apprentissage par renforcement (Reinforcement Learning, RL) plus efficaces et explicab...

Epi-Curriculum : Apprentissage Curriculaire Épisodique pour l’Adaptation de Domaine à Faibles Ressources Contexte de la Recherche et Énoncé du Problème Ces dernières années, la traduction automatique neuronale (Neural Machine Translation, NMT) est devenue une référence dans le domaine de la technologie du traitement du langage naturel. Toutefois, b...

Champ de distance signée régularisé par pseudo-plan pour la reconstruction neuronale de scènes intérieures

AutoStory : Génération d'images narratives diversifiées avec un effort humain minimal

Combattre le bruit des étiquettes avec un modèle de substitution général pour la sélection des échantillons

Exploration des associations d'étiquettes cohérentes homogènes et hétérogènes pour la ré-identification non supervisée des personnes en lumière visible et infrarouge

Aniclipart : Animation de Clipart avec des A Priori Texte-Vidéo

LaVie : Génération de vidéos de haute qualité avec des modèles de diffusion latente en cascade

SLIDE : Un cadre unifié de génération de maillage et de texture avec un contrôle géométrique amélioré et une cohérence multi-vues

De la Comportement au Langage Naturel : Approche Générative pour la Reconnaissance des Intentions des UAV

Q-Cogni : Un cadre intégré d'apprentissage par renforcement causal

Epi-Curriculum : Apprentissage curriculaire épisodique pour l'adaptation de domaine à faible ressource en traduction automatique neuronale