利用生成扩散模型合成拉格朗日湍流

当前,对于湍流中被流体所携带微粒的统计和几何学性质的研究存在重大挑战。尽管过去30年来在理论、数值模拟和实验方面做出了卓越的努力,但目前仍然缺乏能够真实再现湍流微粒轨迹统计和拓扑特性的模型。本研究提出了一种基于最新扩散模型(diffusion model)的机器学习方法,可以生成三维高雷诺数湍流中单个微粒轨迹,从而绕过直接数值模拟或实验获取可靠拉格朗日数据的需求。

论文信息: 本文作者来自罗马大学等机构,发表于2024年4月的《自然机器智能》(Nature Machine Intelligence)期刊。

研究方法: (a) 研究流程 该研究首先利用直接数值模拟(DNS)生成三维纳维-斯托克斯方程组的高雷诺数湍流场,并追踪大量(327,680条)拉格朗日微粒轨迹,构建高质量的训练数据集。然后利用扩散模型(DM)对该数据集进行训练,得到两种模型:DM-1c用于生成单个速度分量,DM-3c用于同时生成三个相关速度分量。

(b) 主要结果
- 生成的合成数据能很好地再现湍流微粒速度增量和加速度的概率分布函数,包括观察到的高阶(60倍标准差)的极端事件尾部。 - 合成数据能精确重现从大尺度到切比雪夫尺度(包括切比雪夫-惯性过渡区)的多时间尺度统计量,如速度增量结构函数、广义峰度等,并捕捉到临界区域的间歇性增强现象。
- 合成数据很好地复现了局部尺度指数的行为,这是湍流统计中最严格的多尺度检验。

© 研究意义 该工作克服了以往理论和模型无法在整个动力学范围内生成具有实际湍流统计特征的合成轨迹的难题。所提出的数据驱动模型能产生高质量、大量的人工数据,为各种湍流应用中需要预训练的下游任务(如扩散、混合等)提供了有力支持。此外,该模型展现出出色的极端事件外推能力,可生成从未见过的高强度、高罕见度事件,同时仍保留真实统计特征。

(d) 研究亮点 - 首次使用最新扩散模型生成三维湍流拉格朗日微粒轨迹 - 高保真度地重现了从大尺度到切比雪夫尺度的各种经典统计量
- 展现出极端事件外推能力,打破了之前模型的局限性 - 为湍流相关领域提供大量高质量合成数据的新途径

(e)
该工作进一步探讨了训练收敛性、泛化能力、解释性和计算代价等问题。尽管目前模型还无法适应不同流动条件,但未来结合条件扩散模型有望实现更广泛的适用性。总的来说,该研究为深入理解湍流现象、加速下游任务的发展提供了有力数据支撑。