分享自:

马来西亚PM2.5浓度的机器学习模型评估

期刊:appl. sci.DOI:10.3390/app11167326

这篇文档属于类型a,即报告了一项单一原创研究的学术论文。以下是针对该研究的详细学术报告:

主要作者及机构

该研究的主要作者包括Nurul Amalin Fatihah Kamarul Zaman、Kasturi Devi Kanniah、Dimitris G. Kaskaoutis和Mohd Talib Latif。他们分别来自马来西亚理工大学(Universiti Teknologi Malaysia)、希腊国家气象观测站(National Observatory of Athens)和马来西亚国立大学(Universiti Kebangsaan Malaysia)。该研究于2021年8月9日发表在期刊《Applied Sciences》上,题为《Evaluation of Machine Learning Models for Estimating PM2.5 Concentrations Across Malaysia》。

学术背景

该研究的主要科学领域是环境科学和空气质量监测,特别是细颗粒物(PM2.5)浓度的估算。东南亚地区(Southeast Asia, SEA)是大气污染和雾霾的热点区域,主要由于森林、农业和泥炭火灾的广泛发生。马来西亚位于这一污染输出的主要路径上,空气质量较差,PM2.5年均浓度超过世界卫生组织(WHO)的限值。PM2.5对人体健康有显著影响,可能导致哮喘、慢性阻塞性肺病、肺癌、心血管疾病等。因此,持续监测PM2.5浓度对于制定改善空气质量的措施至关重要。

传统的地面监测站覆盖范围有限,无法全面反映全国范围的空气质量。卫星遥感技术提供了大范围的气溶胶光学厚度(Aerosol Optical Depth, AOD)数据,结合机器学习(Machine Learning, ML)技术,可以更准确地估算PM2.5浓度。该研究旨在利用随机森林(Random Forest, RF)和支持向量回归(Support Vector Regression, SVR)等机器学习模型,结合卫星AOD观测、地面污染物(NO2、SO2、CO、O3)和气象参数(气温、相对湿度、风速和风向),估算马来西亚全国的PM2.5浓度。

研究流程

研究分为以下几个主要步骤:

  1. 数据收集与预处理

    • 地面数据:包括PM2.5浓度、气象参数(气温、相对湿度、风速、风向)和气体污染物(NO2、SO2、CO、O3)的每小时数据,来自马来西亚65个空气质量监测站,覆盖2018年至2019年。
    • 卫星数据:使用Himawari-8卫星的AOD数据,选择“非常好”质量级别的L3 AOD500数据,空间分辨率为5公里,时间分辨率为每小时。
  2. 模型开发

    • 开发了7个模型,包括1个整体模型、2个空间模型(分别针对城市/工业站点和郊区/农村站点)和4个季节模型(旱季、雨季和两个季风间期)。
    • 使用R语言中的caret包进行模型训练和验证,采用10折交叉验证技术。
  3. 模型验证

    • 将数据随机分为70%用于模型校准,30%用于验证。使用统计指标(R²、RMSE、MBE、NSE)评估模型性能。
  4. 变量重要性分析

    • 使用随机森林模型中的平均减少精度(Mean Decrease Accuracy, MDA)方法,分析各变量对PM2.5估算的贡献。

主要结果

  1. 模型性能

    • 整体模型中,SVR和RF的R²分别为0.69和0.66,RMSE分别为10.62 µg/m³和11.28 µg/m³。
    • 空间模型中,RF在城市/工业站点的表现略优于SVR,R²为0.76,RMSE为11.47 µg/m³;在郊区/农村站点,RF的R²为0.64,RMSE为10.76 µg/m³。
    • 季节模型中,旱季的估算精度最高,雨季和季风间期的精度较低。
  2. 变量重要性

    • CO是PM2.5估算中最重要的变量,其次是AOD、O3、NO2和SO2。气象参数(相对湿度、风向、气温、风速)的贡献较弱。
  3. PM2.5浓度分布

    • 城市/工业站点的PM2.5浓度显著高于郊区/农村站点,旱季的PM2.5浓度最高,雨季最低。
    • AOD与PM2.5的相关性较低,表明大气中存在显著的气溶胶垂直分层。

结论

该研究首次在马来西亚全国范围内利用机器学习模型估算PM2.5浓度,结合卫星AOD、地面污染物和气象参数,取得了较为满意的结果。研究表明,CO是PM2.5估算中最重要的变量,而气象参数的影响较弱。该研究为马来西亚的空气质量监测提供了新的方法,尤其是在缺乏地面监测站的偏远地区。

研究亮点

  1. 创新性:首次在马来西亚全国范围内结合卫星AOD和机器学习技术估算PM2.5浓度。
  2. 多模型比较:开发了7个模型,分别针对不同站点类型和季节,全面评估了模型的性能。
  3. 变量重要性分析:首次在马来西亚的PM2.5估算中详细分析了各变量的贡献,发现CO是最重要的预测变量。

其他有价值的内容

该研究还讨论了卫星遥感技术在空气质量监测中的应用前景,特别是在大范围、高时空分辨率监测中的优势。未来的研究可以进一步结合更多卫星数据(如气体污染物)和土地利用信息,提高PM2.5估算的精度。

通过该研究,研究人员为马来西亚的空气质量改善提供了科学依据,也为其他类似地区的大气污染监测提供了参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com