分享自:

激光雷达与机器学习算法结合的行星边界层高度估算研究

期刊:IEEE Transactions on Geoscience and Remote SensingDOI:10.1109/tgrs.2023.3329122

《Estimation of Planetary Boundary Layer Height from Lidar by Combining Gradient Method and Machine Learning Algorithms》学术报告

作者及研究背景信息

本文的主要作者为Hui Li、Boming Liu、Xin Ma(IEEE会员)、Shikuan Jin、Weiyan Wang、Ruonan Fan、Yingying Ma、Ruyi Wei和Wei Gong,作者主要隶属于武汉大学电子信息学院武汉大学测绘遥感信息工程国家重点实验室(LIESMARS)。文章发表在IEEE Transactions on Geoscience and Remote Sensing期刊2023年第61卷,编号为4107211,出版日期为2023年11月1日,并于2023年10月18日被正式接受。

研究领域及背景

研究领域属于地球科学和遥感,聚焦于“行星边界层(Planetary Boundary Layer, PBL)高度估计”。PBL高度(PBLH)对大气能量和物质交换具有重要影响,是气候模拟和天气预测的关键参数。然而,PBLH的精准测量面临诸多挑战,主要由于复杂的大气条件影响和传统测量方法的局限性。

传统的梯度法(Gradient Method, GM)是基于激光雷达(Lidar)获取的气溶胶廓线梯度变化来推定PBLH,但容易因复杂大气条件引入不确定性。尽管无线电探空仪(Radiosonde, RS)提供直接测量PBLH的能力,但其时间分辨率较低,难以捕捉边界层的日变化特征。因此,研究团队提出结合随机森林(Random Forest, RF)机器学习算法的方法,将传统梯度法输出与多种气象参数相结合,在复杂大气条件下估计PBLH,以提高估算的鲁棒性和精度。

研究目标

本文旨在研发一种结合梯度法和机器学习算法的新模型,并探索这种模型在复杂大气条件下估算PBLH的精度表现。此外,通过灵敏度分析和多种大气条件下的对比分析,研究PBLH的日变化和季节变化规律,并验证该方法的适应性和科学价值。


研究流程与方法

数据来源与研究区域

研究所用数据主要来源于美国ARM(Atmospheric Radiation Measurement)南部大平原(SGP)观测站,时间范围为2017年1月至2021年12月。观测站拥有丰富的观测设备,包括激光雷达、探空气球、辐射计等。研究选择了微脉冲激光雷达(Micropulse Lidar, MPL)与无线电探空仪(RS)的数据:

  1. MPL数据:激光波长为532 nm,用于提供大气气溶胶和云廓线。观测原始数据的时间和空间分辨率分别为10秒和15米。数据经过质量控制与滤波后最终采样为2126小时廓线
  2. RS数据:提供温度、湿度、风速及气压的高分辨率廓线,每天至少观测4次,用于作为参考真实值(PBLHRS)。该研究使用PBL VAP产品(ARM PBL价值增强数据产品)中基于刘氏方法估算的PBLH作为参考。
  3. 其他辅助数据:气象站提供的地表气温、湿度、辐射、土壤温度等参数,以及ARM的多种辐射估算数据,共配对1480小时样本用于研究建模和验证。
方法论
  1. 传统GM方法: GM主要通过RCS(Range-Corrected Signal)廓线中局部最小值提取PBLH,具有一定准确性,但通常受多层气溶胶、背景噪声等因素影响。GM估算范围设置为0.25–3 km以避免系统的硬件重叠影响。

  2. 随机森林(RF)模型设计

    • 输入变量:选择的输入变量包括PBLHGM、RCS最小值高度(GM1、GM2、GM3)、相对湿度(RH)、土壤温度(Soiltem)、净辐射(Netr)、太阳辐射(Solr)、气溶胶层数(ALN)等9个核心因子。
    • 参考值:以RS估测值PBLHRS为训练目标。
    • 参数调整:通过RMSE(均方根误差)和R(相关系数)优化RF模型,最终设定决策树数量为300,叶节点样本量为5。
  3. 模型分析与评估

    • 使用10折交叉验证法进行模型训练与评估。
    • 比较PBLHGM与PBLHRF在不同大气条件下的估算误差、日变化及季节变化规律。

核心研究结果

  1. 灵敏度分析

    • ALN和AOD对PBLH的影响
      • 随着气溶胶层数(ALN)和气溶胶光学厚度(AOD)的增加,传统GM方法的相对误差显著升高,高污染条件下尤为明显。
      • RF模型的误差则随着AOD的增加而逐渐减小,展现出对多层气溶胶的良好适应性。例如在稳定边界层(SBL)条件下,RF方法将GM方法的相对误差从约0.68大幅降低至0.24。
  2. 不同大气条件的表现

    • GM方法局限性:在SBL中,由于残留层导致的弱湍流,PBLHGM常出现系统性高估。
    • RF方法表现:RF充分考虑了ALN、地表热通量和气象参数的影响,不受单一物理机制限制。在SBL、大对流边界层(CBL)和夜间边界层(NBL)条件下均表现稳定,解释变量相关系数R由0.47显著提高至0.80。
  3. 日变化和季节变化

    • PBLH日变化:RF模型发现PBLH低于太阳升起时,随后在正午达到峰值,而日落后逐渐降低,与PBLHRS表现一致。相较之下,GM方法日变化不显著。
    • PBLH季节变化:PBLH在夏季达到最高(主要受较高地表温度和强太阳辐射驱动),冬季最低。RF对夏季估算的精度尤为突出,相关系数达0.83。
  4. 关键变量贡献: RH和GM1是RF模型最重要的输入变量,分别占总贡献的21%和16%。RH通过调节地表热通量影响边界层高度,而GM1为搜索层顶提供了重要的先验信息。


研究结论与科学意义

本文基于ARM多源数据,通过将传统梯度法与机器学习方法结合,研发了一种稳定且高精度的PBLH估算方法。与传统的GM方法相比,RF方法构建在多输入变量的基础上,可有效克服复杂大气条件对PBLH估算的干扰。RF的预测结果与RS高度一致,相关系数达到0.8以上。

本研究揭示了ALN和AOD对传统PBLH估算的重大影响,并证明RF算法可以通过整合多变量显著提高估算精度。此外,PBLH的日变化和季节变化的发现有助于理解边界层的发展机制,为环境监测、气候模型和污染控制提供了数据支持。


研究亮点

  1. 首次在梯度法中引入RF机器学习模型,克服多层梯度与背景噪声干扰。
  2. 利用长时间序列多源数据(MPL、RS和气象数据),验证了RF模型对复杂大气条件的适应性。
  3. 提供了对PBLH日变化和季节变化的精准分析,为气象与空气质量研究提供重要参考。

应用价值与未来展望

此研究为精准大气边界层观测与遥感解译构建了新范式,未来可进一步引入更多传统算法的先验估算结果与地表气象数据,进一步优化模型的泛化性能。同时,本研究为理解边界层与气候系统的相互作用提供了关键数据和方法支持。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com