Adaptation partielle de domaine pour la construction d'un modèle de lithologie de forage sous un a priori géologique plus faible
Sujet et problématique étudiés
L’identification lithologique joue un rôle essentiel dans l’analyse des caractéristiques stratigraphiques et l’exploration pétrolière et gazière. Cependant, les méthodes d’identification basées sur l’intelligence artificielle (IA) et l’apprentissage automatique rencontrent des défis majeurs lorsqu’elles sont utilisées pour analyser des données de forage provenant de différents puits. Parmi ces défis, citons :
- Disparités dans la distribution des données entre les puits d’origine et les puits cibles causées par la variabilité des environnements sédimentaires et des équipements de mesure.
- Incertitudes sur les classes lithologiques dans le puits cible : les nouvelles forages peuvent contenir des classes lithologiques qui n’ont pas été rencontrées dans les puits sources, créant un problème d’espace de classes inconnu ou “unshared label space”.
Cet article propose une approche innovante basée sur une méthode d’adaptation partielle de domaine (Partial Domain Adaptation, PDA), nommée “Sample Transferability Weighting based Partial Domain Adaptation” (ST-PDA). Cette méthode vise à surmonter les limitations actuelles et à résoudre les problèmes liés à la prédiction lithologique pour des puits cibles présentant des étiquettes inconnues, en s’appuyant sur les données sources.
Informations sur l’article
L’article, écrit par Jing Li, Jichen Wang, Zerui Li, Yu Kang et Wenjun Lv, a été publié dans le IEEE Transactions on Artificial Intelligence (décembre 2024). Les auteurs sont affiliés au Département d’automatisation de l’Université des sciences et technologies de Chine ainsi qu’à son Institut des technologies avancées. Cette recherche a été soutenue par plusieurs programmes de financement prestigieux, tels que le Fonds national chinois pour la recherche en sciences naturelles et le Programme national clé de recherche et développement.
Contributions méthodologiques
Méthodologie proposée : ST-PDA
Le cadre présenté dans l’article, ST-PDA, repose sur trois composantes principales pour répondre aux défis de la prédiction lithologique dans des contextes de domaine inconnu.
Module de pondération de la transférabilité des échantillons :
Ce module évalue automatiquement la probabilité qu’un échantillon source appartienne à un espace d’étiquettes partagé avec le domaine cible. Les échantillons des classes non partagées reçoivent des pondérations plus faibles, ce qui permet de réduire efficacement les transferts négatifs.Réseau neuronal convolutionnel avec un mécanisme intégré d’attention par canal (CG2CA) :
Ce module sert de backbone pour l’extraction des caractéristiques. Il intègre un mécanisme d’attention basé sur des moyennes et maxima globaux (GAP et GMP), permettant une identification plus fine des caractéristiques lithologiques clés.Module de reconstruction des échantillons cibles :
Ce module améliore la représentation des caractéristiques dans le domaine cible grâce à des techniques de dé-convolution, permettant de renforcer le transfert positif depuis le domaine source.
Processus en plusieurs étapes
Alignement des distributions entre domaines et extraction de caractéristiques :
En utilisant un réseau neuronal adversarial de domaine (DANN), les distributions de données des puits sources et cibles sont alignées pour extraire des caractéristiques invariantes au domaine.Analyse de la transférabilité des échantillons :
Les poids de transférabilité sont assignés dynamiquement aux échantillons sources afin d’accentuer l’alignement des catégories partagées et d’atténuer l’impact des classes non partagées.Classification lithologique et reconstruction dans le domaine cible :
Ce dernier volet affine les classifications par une reconstruction explicite des échantillons cibles, permettant une meilleure généralisation des modèles.
Données et expériences
Description des jeux de données
L’étude repose sur des données provenant de 16 puits exploratoires réels situés dans la dépression de Jiyang (Bassin Bohai, Chine). Les données incluent six courbes de logging fréquemment utilisées :
- Courbe acoustique (AC)
- Gamme-ray neutres compensée (CNL)
- Rayons gamma (GR)
- Résistivité à gradient bas (R25)
- Potentiel spontané (SP)
Les catégories lithologiques incluent :
- Mudstone (MS) : Argile
- Sandstone (SS) : Grès
- Oil Shale (OS) : Schiste bitumineux
- Dolomite (DM) : Dolomie
Trois scénarios de données ont été simulés pour tester ST-PDA dans des conditions réalistes : 1. Dataset I : Les puits cibles n’ont aucune étiquette de catégorie OS. 2. Dataset II : Les catégories OS dans les puits cibles sont rares. 3. Dataset III : Les catégories OS dans les puits cibles sont légèrement représentées.
Mesures d’évaluation
Les performances du système sont évaluées via trois métriques : - L’exactitude (Accuracy, ACC). - Le rappel macro-moyenné (Macro-Recall, Macro-R), mesurant la performance sur chaque catégorie, y compris les minorités comme OS, indépendamment du déséquilibre des données. - Le nombre d’erreurs d’identification pour OS (False-OS, F-OS).
Résultats expérimentaux
Résultats sur Dataset I
- Performances globales : ST-PDA obtient un Macro-R de 85,52%, surclassant la deuxième meilleure méthode (ETN, 80,80%). L’exactitude atteint également un pic à 92,09%.
- Élimination des erreurs pour OS : ST-PDA réduit les erreurs d’attribution de la catégorie OS avec F-OS = 0, démontrant son efficacité à traiter les classes non partagées.
Résultats sur Datasets II et III
- Dataset II (catégories OS rares) : Dans le cas spécifique de wg→wh, ST-PDA atteint un rappel exceptionnel pour OS (85,71%, +7,14% par rapport à ETN).
- Dataset III (quelques OS) : Pour l’expérience wi→wj, ST-PDA maintient un Macro-R de 84,67% avec le plus grand nombre d’échantillons OS correctement prédis parmi toutes les méthodes (72).
Analyse des composants via des expériences d’ablation
Les expériences d’ablation explorent l’importance de chaque composant de ST-PDA : - Remplacer CG2CA par un CNN standard diminue le Macro-R de 3,93%. - Retirer le module de pondération réduit Macro-R de 6,72%. - Supprimer la reconstruction des échantillons cibles entraîne une perte de 4,46% en Macro-R.
Ces résultats soulignent l’importance de chaque module et indiquent que la combinaison des trois est essentielle pour des performances optimales.
Contributions et impacts
Contributions
- Nouvelle approche pour la PDA appliquée à la lithologie : ST-PDA introduit un cadre novateur qui combine alignement de domaine, pondération dynamique et reconstruction de cibles, résolvant les problèmes liés aux espaces d’étiquettes inconnus.
- Réduction des erreurs pour OS : L’élimination des transferts négatifs permet d’éviter les prévisions erronées pour des catégories absentes du domaine cible.
Perspectives futures
Pour l’avenir, il est recommandé de se pencher sur : - Une meilleure séparation des classes lithologiques étroitement liées. - L’application de ST-PDA à d’autres domaines géologiques, tels que la prévision des propriétés des réservoirs carbonatés complexes.
ST-PDA marque une avancée remarquable dans les prévisions géologiques et offre des solutions pratiques et fiables pour l’exploration pétrolière.