Un modèle de détection visuelle biomimétique : LGMDs à déclenchement événementiel mis en œuvre avec des circuits neuronaux à spikes fractionnaires

Un modèle de détection visuelle biomimétique : LGMDs à déclenchement événementiel mis en œuvre avec des circuits neuronaux à spikes fractionnaires

Rapport académique : Étude d’un modèle de détection visuelle biomimétique basé sur les circuits neuraux à impulsions fractionnaires Dans les domaines de la conduite intelligente autonome et des véhicules aériens sans pilote, la capacité de prédire rapidement et efficacement les collisions et de déclencher des actions d’évitement revêt une importanc...

IoU du champ de vision pour la détection d'objets dans des images à 360°

Détection d’objets dans les images à 360° à l’aide de l’IoU FOV Ces dernières années, les caméras à 360° ont été largement utilisées dans de nombreux domaines tels que la réalité virtuelle, la conduite autonome et la surveillance de sécurité. Avec l’augmentation des données d’images à 360°, la demande de tâches de reconnaissance d’images à 360°, en...

dvmark: un cadre multicouche profond pour les filigranes vidéo

dvmark: un cadre multicouche profond pour les filigranes vidéo

DVMark : Cadre de filigrane vidéo basé sur l’apprentissage profond multi-échelle La technologie de filigrane vidéo cache des données en intégrant des informations dans la vidéo hôte. Le modèle DVMark proposé dans cet article est une solution de filigrane vidéo basée sur l’apprentissage profond multi-échelle, offrant une robustesse et une praticité ...

Réseau de Déconvolution Empilé pour la Segmentation Sémantique

Réseau de Déconvolution Empilé pour la Segmentation Sémantique

Réseau Deconvolutionnel Empilé pour la Segmentation Sémantique Introduction La segmentation sémantique est une tâche clé dans le domaine de la vision par ordinateur, visant à classer chaque pixel d’une image en prédisant sa catégorie. Toutefois, les réseaux entièrement convolutionnels (Fully Convolutional Networks, FCNs) existants présentent des li...

FP-AGE: Exploiter l'Attention du Parsing du Visage pour l'Estimation de l'Âge du Visage dans la Nature

FP-AGE: Exploiter l'Attention du Parsing du Visage pour l'Estimation de l'Âge du Visage dans la Nature

FP-Age : Estimation de l’Âge du Visage en Environnement Sauvage en Utilisant un Mécanisme d’Attention d’Analyse Faciale Contexte de la Recherche Estimer l’âge à partir des images de visage est une tâche importante en vision par ordinateur, possédant un large éventail d’applications pratiques notamment en criminalistique, sécurité, santé et bien-êtr...

TGFuse: Une approche de fusion d'images infrarouges et visibles basée sur le transformateur et le réseau antagoniste génératif

TGFuse: Une approche de fusion d'images infrarouges et visibles basée sur le transformateur et le réseau antagoniste génératif

TGFuse : Méthode de Fusion d’Images Infrarouges et Visibles Basée sur Transformer et Réseau Génératif Adversarial Introduction Avec le développement des équipements d’imagerie et des méthodes d’analyse, les données visuelles multimodales émergent rapidement, avec de nombreuses applications pratiques. Parmi ces applications, la fusion d’images joue ...

Apprentissage de Correspondance Temporelle Non Supervisée pour le Retrait d'Objet Vidéo Unifié

Apprentissage de Correspondance Temporelle Non Supervisée pour le Retrait d'Objet Vidéo Unifié

Apprentissage de la cohérence temporelle non supervisée pour la suppression cohérente d’objets dans les vidéos Contexte de l’étude et motivation Dans le domaine de l’édition et de la restauration de vidéos, la suppression d’objets vidéo (Video Object Removal) est une tâche importante. Son objectif est d’effacer des objets cibles dans une vidéo enti...

CLASH : Apprentissage Complémentaire avec Recherche d'Architecture Neuronale pour la Reconnaissance de la Démarche

CLASH : Apprentissage Complémentaire avec Recherche d'Architecture Neuronale pour la Reconnaissance de la Démarche

CLASH : Cadre de reconnaissance de la démarche basé sur l’apprentissage complémentaire et la recherche d’architecture neuronale Contexte de la recherche La reconnaissance de la démarche est une technique biométrique qui identifie les individus en fonction de leur façon de marcher. Cette technique a de larges applications dans des domaines tels que ...

Vers une évaluation transparente de l'esthétique des images profondes avec des descripteurs de contenu basés sur des étiquettes

Vers une évaluation transparente de l'esthétique des images profondes avec des descripteurs de contenu basés sur des étiquettes

Évaluation esthétique des images profondes transparentes basée sur la description du contenu des étiquettes Contexte académique Avec la popularité croissante des plateformes de médias sociaux comme Instagram et Flickr, la demande pour les modèles d’évaluation esthétique des images (Image Aesthetics Assessment, IAA) augmente. Ces modèles peuvent non...

Équilibrer l'Alignement des Caractéristiques et l'Uniformité pour la Classification avec Peu d'Échantillons

Équilibrer l'Alignement des Caractéristiques et l'Uniformité pour la Classification avec Peu d'Échantillons

Alignement et Uniformité des Caractéristiques Équilibrées pour Résoudre le Problème de Classification avec Peu d’Échantillons Contexte et Motivation L’apprentissage avec peu d’échantillons (Few-Shot Learning, FSL) vise à reconnaître correctement de nouveaux échantillons dans des classes nouvelles avec seulement quelques exemples disponibles. Les mé...