基于样本可迁移性加权的部分域适应用于构建钻孔岩性模型
基于弱地质先验的孔隙构建岩性模型的部分域适配研究
背景与研究问题
岩性识别在地层特性分析和油气储层勘探中扮演着至关重要的角色。然而,现有的基于人工智能和机器学习的岩性识别方法,在处理跨井数据时,仍面临着严峻的挑战。具体而言,由于各井之间复杂的沉积环境、不一致的物探设备及测量技术,导致跨井数据分布差异显著。此外,目标井可能包含全新的岩性类别,与已标注的源井数据之间存在标签空间的不一致性 (unshared label space),这进一步加剧了模型在目标井中预测的难度。
本研究提出了一种基于部分域适配(Partial Domain Adaptation,PDA)的创新框架,用于实现复杂地质条件下的跨井岩性预测。核心挑战在于: 1. 数据分布的显著差异导致源井训练的模型无法直接适用于目标井数据。 2. 目标井中的岩性类别可能与源井数据完全不同,甚至包含全新岩性类别。 为此,该研究提出了一种多模块方法,旨在应对目标领域未知标签空间的实际问题。
论文信息
本文由Jing Li、Jichen Wang、Zerui Li、Yu Kang及Wenjun Lv等学者共同撰写,作者均隶属于中国科学技术大学自动化系及其先进技术研究院。文章发表于2024年12月的《IEEE Transactions on Artificial Intelligence》,并得到了国家自然科学基金、国家重点研发计划、安徽省高校协同创新项目等多项基金的支持。
方法与研究流程
本文提出了“基于样本可转移性加权的部分域适配” (Sample Transferability Weighting based Partial Domain Adaptation, ST-PDA) 框架,并设计了一种多步骤流程以全面解决跨井岩性预测问题。以下是研究的具体流程与技术细节。
1. 方法设计
本研究设计了三个核心模块: 1. 样本可转移性加权模块:用于计算源井样本与目标井共享类的概率,针对跨域未共享类 (unshared classes) 样本分配较低的权重,从而有效减轻负迁移问题。 2. 卷积神经网络结合通道注意力机制的特征提取器 (CNN with Channel Attention, CG2CA):该网络具备综合提取大范围判别性特征的能力,并通过通道注意力机制进一步筛选关键信息。这一模块强调了岩性特征的区分性。 3. 目标样本重建模块:通过去卷积 (deconvolution) 方法对目标井样本进行重构,从而增强目标井数据的特征表示,促进源目标域的知识迁移。
2. 研究步骤
具体实验设计包括以下步骤: - 数据分布对齐与特征提取:通过域对抗神经网络 (Domain Adversarial Neural Network, DANN) 进行数据分布对齐,提取跨域不变特征。 - 样本可转移性分析:基于模型的域分类器 (Domain Classifier) 和目标域伪标签,动态评估样本的可转移性权重。 - 岩性分类与目标域优化:结合样本权重,进一步调整分类器和特征提取网络的参数。 - 目标样本重建:使用去卷积技术实现样本重构,提升目标域特征表示质量。
数据与实验
数据集描述
研究选用了中国渤海湾盆地济阳坳陷内的16口实测井数据,综合声波、自然伽马射线、视电阻率等六条测井曲线,构成高维输入特征。岩性类别包括泥岩 (Mudstone, MS)、砂岩 (Sandstone, SS)、油页岩 (Oil Shale, OS) 和白云岩 (Dolomite, DM)。实验总共设计了三个数据集来模拟目标井是否存在未知岩性或弱先验知识的真实场景: 1. 数据集I:目标井无OS类标签。 2. 数据集II:目标井OS类标签稀少。 3. 数据集III:目标井OS类标签有少量样本。
评价指标
模型性能通过三项指标进行评估:准确率 (Accuracy, ACC)、宏平均召回率 (Macro-Recall, Macro-R) 和OS类别误判样本数 (False-OS, F-OS)。Macro-R在岩性类别分布不均的情况下尤为重要,用于反映模型对少数类的表现。
研究结果与分析
数据集I实验结果
ST-PDA方法相较其他方法展现出卓越的综合能力: 1. 在多个实验对比中,ST-PDA获得最高的Macro-R(如85.52%),显著优于第二名方法ETN (80.80%)。 2. ST-PDA实现了对目标井的完全OS类误判消除 (F-OS=0),反映了其在未共享类别映射中的能力。 3. 性能可视化验证了ST-PDA对不同类别的良好区分性,尤其是对DM等少数类别的分离效果远优于对比方法。
数据集II和III实验结果
对于目标井包含稀少或少量OS样本的情况,ST-PDA同样表现出色。例如: 1. 在数据集II中,ST-PDA对OS类别的召回率高达85.71%,较ETN提升了7.14%。 2. 在数据集III中,ST-PDA对OS的召回率达到82.76%,并准确预测了72个目标OS样本。
消融实验与模块验证
通过移除或替换关键模块的消融实验,进一步证明了每一个模块的不可或缺性: - 用传统CNN替代CG2CA,模型Macro-R下降了3.93%。 - 移除目标样本重建模块后,ACC下降了约3.7%。
研究意义与未来展望
通过大规模实测井数据实验,本文提出的方法ST-PDA展现了显著的科学价值与应用价值: 1. 科学价值:从理论上解决了跨井岩性预测的部分域适配问题,特别是在标签空间未知情况下的优异表现。 2. 应用价值:为复杂地质环境下的油气资源勘探提供了高效、精准的岩性识别方法,避免传统方法中的人才依赖和误判。
未来研究可尝试进一步优化域不变特征的类别区分性,尤其是减少岩性类别边界上的样本混淆误差,同时扩展ST-PDA至更复杂的跨域任务中。
亮点总结
- 提出具有创新性的局部域适配方法,结合样本加权和目标重构,首次解决目标井标签空间未知的跨域岩性预测问题。
- 基于可转移性加权模块与CG2CA网络,提升了少数类岩性预测的召回率与总体准确性。
- 在16口实测井数据的多组实验中,ST-PDA显著优于当前最先进方法,展现出极高的工程推广潜力。