深度神经网络解决多体薛定谔方程中自旋对称性解的问题
深度学习框架用于多体薛定谔方程的自旋对称解研究:一种新方法的开创性成果
量子物理和量子化学领域中,多体电子体系的描述一直是一个重要但极具挑战性的课题。准确表征电子-电子强关联尤其对催化、光化学和超导性等领域具有深远意义。然而,传统的方法,如广泛使用的Kohn–Sham密度泛函理论(KS-DFT),在多参考体系中对静态关联的描述仍存在不足。这一不足导致了所谓的“对称性困境”(symmetry dilemma),即自旋对称破缺的解尽管是不物理的状态,却能获得较低的能量结果。此外,虽然波函数方法在捕获静态关联方面表现出色,但其计算复杂度较高,需要专家选择合适的活性空间,对普通应用存在显著障碍。因此,找到一种高效且准确的方法来解决多体薛定谔方程,同时保持正确的自旋对称性,这是科学家们长期以来期待解决的问题。
在此背景下,由ByteDance Research、北京大学物理学院等多个研究机构的合作团队撰写的学术论文《Spin-symmetry-enforced solution of the many-body Schrödinger equation with a deep neural network》发表在2024年12月的《Nature Computational Science》。文章致力于在神经网络与变分蒙特卡洛(Neural-network-based Variational Monte Carlo, NN-VMC)方法的结合框架下,提出具有自旋对称性强制约束的新方法。通过这一框架,研究团队解决了准确计算多体量子态的难题,在多个强相关系统中取得了振奋人心的研究成果。本报告将对该文章进行深入解析,包括其研究背景、科研流程、主要结果及结论和研究亮点等。
研究流程解析
本文研究提出了一种改进的神经网络变分蒙特卡洛方法,通过在优化函数中加入自旋对称性约束的罚函数(penalty term),实现对基态和激发态量子态的高效计算。该研究的具体流程清晰而复杂,主要包括以下几部分内容:
1. 基态优化与NN-VMC方法的改进
研究的第一部分专注于如何在NN-VMC的优化过程中消除自旋污染(spin contamination)。在传统NN-VMC中,优化后的神经网络波函数通常不是自旋平方算符(𝑆̂²)的本征函数,导致自旋污染问题。对此,研究团队引入了低复杂度的罚函数,基于自旋提升算符(𝑆̂⁺)的性质设计了𝑆̂⁺罚函数,从而在计算成本几乎不增加的情况下强制波函数满足目标自旋对称性。实验结果表明,该罚函数在基态优化过程中显著改善了优化过程,例如,在具有近简并态(如乙烯分子扭曲构型)的系统中,成功获得了正确的自旋对称性,并提升了基态能量的准确性。
2. 激发态计算与效率提升
论文的第二部分处理了激发态的高效计算问题。此前的NN-VMC工作在计算激发态时需考虑低于目标态能量的所有中间态,带来了计算复杂度较高的缺陷。而本研究通过结合所提出的自旋对称性罚函数与现有的重叠罚方法,实现了对高阶激发态的有效求解。多个典型系统(如氮原子)的计算表明,该方法能够跳过中间低能态直达目标高能激发态,相较其他方法显著减少训练态数量与重叠罚项数目,展现出极大的计算效率与准确性优势。此外,对于某些难以捕捉的激发状态(例如甲醛分子的特定激发态),该方法也成功模拟,为激发态研究提供了新的工具。
3. 自旋间隙(spin-gap)计算与双自由基体系验证
在双自由基系统(如乙烯和亚甲基)的研究中,自旋单-三隙(singlet-triplet gap)是决定其化学反应性与光物理性质的重要量。然而,由于这些系统的多参考特性,准确计算其自旋间隙对量子化学一直是一大挑战。通过将自旋对称性罚函数与方差外推(variance extrapolation)结合应用,研究团队对多个自由基系统进行了深入分析。结果显示,其计算得到的单-三隙值与实验结果及其他高精度的辅助场量子蒙特卡洛方法(auxiliary-field quantum Monte Carlo, AFQMC)相当,有时甚至优于后者,且无需选择活性空间或基组等先验化学知识,进一步验证了该方法的稳健性和精确性。
研究结果及意义
1. 数据支持和结论
本文通过大量数值实验对其新方法进行了严格验证,涵盖原子(如氮、氧)及分子体系(如乙烯、甲醛等)。实验结果表明,引入的𝑆̂⁺罚方法在时间复杂度优化(从𝒪(n²)到𝒪(n))、基态能量准确性、自旋污染消除及激发态捕捉等方面表现优秀。这一成果确立了在NN-VMC框架中强制自旋对称性的可行性,为多体薛定谔方程求解提供了一种高效而通用的全新方法。
在科学价值方面,该方法拓展了神经网络在量子化学中的应用边界,为准确计算量子系统的自旋相关态及相关特性(如光化学反应动力学、磁性材料设计等)提供了坚实的理论工具。在应用价值方面,平台的开源代码(JaqMC)不仅可供研究者验证论文结果,还能为诸多相关领域提供高效的量子态优化算法,具有广泛的实践潜能。
研究亮点
- 理论与方法创新:创新性地提出了基于自旋提升算符的低复杂度罚函数,与传统自旋平方算符罚方法相比,显著优化了时间复杂度。
- 多态共存问题的解决:对多参考体系中的近简并态和激发态计算具有显著优势,能够对多种复杂体系(如双自由基体系)进行高精度建模。
- 普适性与开源实现:该方法不仅适配NN-VMC,还可推广至其他波函数方法,并提供了开源工具箱供学术界使用。
总结与展望
本文在NN-VMC研究的基础上引入了自旋对称性强制约束的新方法,不仅在计算效率与性能上取得了长足进展,也为未来量子态的研究提供了新的框架。虽然当前工作仍面对高阶激发态计算与复杂系统模拟的挑战,但其为量子物理及化学的多个研究方向(如光电材料设计、过渡金属催化研究)奠定了重要基石。
未来的研究可聚焦于进一步提高计算效率、适用更大规模系统或探索新的量子体系可能性,在此基础上推动量子科学及应用技术新的跨越式发展。