George EM Karniadakis及其合作者的文章《Physics-informed Machine Learning》发表于2021年5月的《Nature Reviews Physics》,主要讨论了如何将物理学的基本法则融入机器学习(machine learning, ML)的方法论,以及在这些方法上的最新进展和应用潜力。
本文的主要作者包括George EM Karniadakis(Brown University)、Ioannis G. Kevrekidis(Johns Hopkins University)、Lu Lu(Massachusetts Institute of Technology)、Paris Perdikaris(University of Pennsylvania)、Sifan Wang(University of Pennsylvania)以及Liu Yang(Brown University)。论文在《Nature Reviews Physics》上发表,并已获得广泛引用,反映了其研究在学术界中的重要性。
在多物理场和多尺度系统中,模拟和预测动态行为始终是科学领域的一大挑战。例如,地球系统的动态受物理、化学和生物过程的复杂交互影响,这些过程涉及跨越17个数量级的时间-空间尺度。在过去几十年中,通过有限差分法、有限元法、谱方法以及无网格法等方法数值求解偏微分方程(Partial Differential Equations, PDEs),科学家在理解多尺度物理问题上取得了巨大进步。然而,传统方法在解决非线性多尺度系统、不确定性反演问题、以及处理带有噪声或缺失边界条件的实际物理问题上仍面临严峻挑战。此外,构建和更新这些方法所需的复杂算法和计算代码往往花费高昂的成本。
在这种情况下,观测数据的重要性日益凸显。通过传感器网络、卫星遥感等技术,研究者们已经收集了庞大的多精度观测数据,但如何将这些海量数据无缝整合到现有的物理模型中,仍然是亟待解决的难题。尽管数据同化技术已经有了显著进展,但在各种数据异质性和模型普遍缺乏统一性的背景下,需要一种革命性的研究方法。
物理引导的机器学习(Physics-Informed Machine Learning, PIML)通过在机器学习模型中嵌入物理法则,建立了一种连接数据与数学模型的新方式。它通过神经网络或其他基于核的回归技术将噪声观测数据与方程约束结合在一起。以“物理引导神经网络(Physics-Informed Neural Networks, PINNs)”为例,这种深度学习技术将偏微分方程的约束嵌入损失函数中,同时结合自动微分技术,在连续空间-时间域内处理问题。
虽然机器学习在数据建模和高维关联的识别上具有巨大潜力,但其结果往往缺乏物理一致性。纯数据驱动方法易受到观测偏差和外插的影响,难以推广应用到物理意义不明确的问题中。因此,作者提出,融入物理法则的机器学习能够通过提供“信息先验”(informative priors),显著改善模型的性能和解释性。
物理引导学习方法分为以下三种途径: - 观测偏置(Observational Biases):通过观测数据反映物理法则; - 归纳偏置(Inductive Biases):在网络架构设计中显式嵌入对称性和守恒定律; - 学习偏置(Learning Biases):通过软约束的损失函数,在模型训练中引导对物理法则的遵循。
这些偏置可以单独使用,也可结合形成混合方法,提高模型对物理问题的解释能力。
文中提出,PINNs特别适用于求解高维、非结构化问题,尤其是在处理不完全模型和不完美数据时,表现出显著优越性。例如,文中强调了PINNs在湍流建模、生物力学建模(如4D-Flow MRI数据去噪)、材料科学(如非破坏性测试)中的潜在应用价值。
支持证据包括: - 在湍流模拟中,PINNs被用于从部分观测中重构湍流电场; - 在材料科学中,PINNs通过反问题推断准确提取了金属材料属性。
本文通过系统性综述当前PIML的主流方法、研究趋势与应用案例,为跨学科研究者提供了清晰的思路和技术框架。PIML不仅为复杂物理、工程问题提供优越的解决能力,还推动了物理与数据科学的深度融合,代表了科学与技术发展的重要方向。