分享自:

基于Phillips离子性理论的机器学习在带隙和激子结合能预测中的应用

期刊:J. Phys. Chem. Lett.DOI:10.1021/acs.jpclett.9b02232

本文由Jiechun Liang和Xi Zhu共同撰写,分别来自香港中文大学(深圳)科学与工程学院以及深圳人工智能与机器人研究院(AIRS)。该研究于2019年9月3日发表在《The Journal of Physical Chemistry Letters》期刊上,题为“Phillips-Inspired Machine Learning for Band Gap and Exciton Binding Energy Prediction”。研究的主要目标是通过结合Phillips的离子性理论和机器学习(ML)技术,开发一种能够准确预测材料带隙(band gap)和激子结合能(exciton binding energy, EB)的模型,并展示其在材料科学中的广泛应用潜力。

学术背景

在材料科学中,带隙和激子结合能是决定材料电子和光学性质的关键参数。传统的计算方法,如密度泛函理论(Density Functional Theory, DFT),虽然在基态计算中表现出色,但在带隙预测上存在低估问题。更精确的方法,如GW方法,虽然能够提供更准确的结果,但其计算成本极高,难以大规模应用。此外,激子结合能的计算通常依赖于Bethe-Salpeter方程(BSE),这同样需要高精度的带隙数据作为输入,进一步增加了计算负担。

为了在精度和计算成本之间找到平衡,机器学习技术被引入材料科学领域。然而,现有的机器学习模型虽然在数值上表现出色,但往往缺乏对物理规律的深入理解,导致模型的可解释性和可迁移性较差。本文的研究正是为了解决这一问题,通过结合Phillips的离子性理论,开发了一种具有物理基础的机器学习模型,能够在少量数据的情况下实现高精度的带隙和激子结合能预测。

研究流程

研究的主要流程包括以下几个步骤:

  1. 数据准备:研究使用了来自计算二维材料数据库(C2DB)的3693种二维材料数据作为训练集,并结合了NREL数据库中的材料作为测试集。数据集中包含了材料的多种特征,如带隙、离子性、晶格类型等。

  2. 机器学习模型构建:研究采用了Lasso(Least Absolute Shrinkage and Selection Operator)算法进行机器学习建模。Lasso是一种回归分析方法,能够通过特征选择来减少模型的复杂性。为了提高模型的物理可解释性,研究引入了Phillips的离子性理论,将带隙的物理特征(如离子性和晶格类型)作为输入特征。

  3. 带隙预测:研究首先对DFT计算的带隙(Eg_DFT)进行预测,结果显示模型在训练集和测试集上均表现出色,R²值分别为0.97和0.88,平均绝对误差(MAE)为0.12 eV。随后,研究进一步对GW修正的带隙(Eg_GW)进行预测,结果显示R²值达到0.99,MAE为0.26 eV,表明模型在跨数据库预测中具有较高的准确性。

  4. 激子结合能预测:研究还利用机器学习模型对激子结合能(EB)进行了预测。通过将激子结合能分为两个区间(EB < 1 eV和EB ≥ 1 eV),模型能够更好地捕捉不同区间内的物理规律。结果显示,模型在训练集和测试集上的R²值分别为0.94和0.97,MAE为0.04 eV。

主要结果

研究的主要结果包括:

  1. 带隙预测的准确性:通过引入Phillips的离子性理论,模型在带隙预测中表现出色,尤其是在跨数据库预测中,模型能够准确预测3D材料的带隙,展示了其强大的可迁移性。

  2. 激子结合能的物理解释:模型不仅能够准确预测激子结合能,还能够揭示其背后的物理规律。例如,在低能区间(EB < 1 eV),极化率(α)是影响激子结合能的主要因素;而在高能区间(EB ≥ 1 eV),带隙(Eg_GW)则成为主导因素。

  3. 物理驱动的机器学习模型:研究通过引入物理特征(如离子性和晶格类型),显著提高了模型的可解释性。与传统的机器学习模型相比,本文的模型不仅能够提供准确的数值预测,还能够揭示数据背后的物理规律。

结论与意义

本文的研究展示了物理驱动的机器学习模型在材料科学中的巨大潜力。通过结合Phillips的离子性理论,研究开发了一种能够在少量数据情况下实现高精度预测的机器学习模型。该模型不仅在带隙和激子结合能预测中表现出色,还能够揭示数据背后的物理规律,为材料科学中的“少样本”问题提供了新的解决方案。

此外,研究还强调了物理规律在机器学习中的重要性。传统的机器学习模型虽然在数值上表现出色,但往往缺乏对物理规律的理解,导致模型的可解释性和可迁移性较差。本文的研究通过引入物理特征,显著提高了模型的可解释性,为未来的机器学习研究提供了新的思路。

研究亮点

  1. 物理驱动的机器学习模型:研究通过结合Phillips的离子性理论,开发了一种具有物理基础的机器学习模型,显著提高了模型的可解释性和可迁移性。

  2. 高精度的带隙和激子结合能预测:模型在带隙和激子结合能预测中表现出色,尤其是在跨数据库预测中,展示了其强大的应用潜力。

  3. 少样本问题的解决方案:研究展示了物理驱动的机器学习模型在少量数据情况下的有效性,为材料科学中的“少样本”问题提供了新的解决方案。

其他有价值的内容

研究还探讨了机器学习模型在材料科学中的其他应用潜力,如材料的总能量预测和晶体结构的分类。通过引入物理特征,模型不仅能够提供准确的数值预测,还能够揭示数据背后的物理规律,为未来的材料科学研究提供了新的工具和方法。

总的来说,本文的研究为物理驱动的机器学习模型在材料科学中的应用提供了重要的参考,展示了其在带隙和激子结合能预测中的巨大潜力,并为未来的研究提供了新的思路。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com