2393 字
12 分钟
Samudra: 一个用于气候研究的全球海洋AI模拟器

****

海洋作为气候系统的重要组成部分,其动力学和热力学过程对全球气候具有深远的影响。为了理解和预测海洋在气候变化中的作用,科学家们依赖于复杂的海洋数值模式计算模拟。然而,运行这些数值模式通常需要大量的计算资源,并且运行时间长,这使得大规模模拟和参数研究变得十分困难。

近年来,人工智能(AI)和机器学习(ML)技术在气候系统建模领域展现出巨大的潜力。特别是,AI模拟器在模拟气候系统中的各个组成部分(尤其是大气)方面取得了显著的成功。例如,AI模型在天气预报、极端天气事件预测以及大气环流模拟等领域都表现出了优异的性能。这些AI模拟器能够显著加速计算过程,并为大规模气候研究提供了新的可能。

GRAPHDOP: TOWARDS SKILFUL DATA-DRIVEN MEDIUM-RANGE

WEATHER FORECASTS LEARNT AND INITIALISED DIRECTLY

FROM OBSERVATIONS

然而,构建能够处理长期气候模拟且在时空尺度上都具备高精度的海洋模拟器仍然是一项挑战。目前,传统的海洋数值模式,如OM4,虽然在模拟海洋环流和热力学方面具有较高的准确性,但其计算成本高昂,限制了其在长期气候模拟和参数敏感性研究中的应用。此外,许多现有的海洋AI模拟器往往只关注海洋表层或浅层区域,而忽略了深海对气候变化的潜在影响。部分模拟器还面临着长期稳定性不足的问题,难以进行长时间尺度(如数十年甚至数百年)的模拟。

本文介绍一种能够模拟整个海洋深度的全球海洋模拟器Samudra,并展示其在长期稳定性、气候学特征再现和计算效率方面的性能。

训练数据#

Samudra 模拟器的训练数据来自海洋环流模式OM4的模拟结果,该模型是耦合气候模型CM4的海洋组成部分。OM4模型运行了65年(1958-2022),并提供了一系列海洋要素变量数据,包括:

  • 三维变量: 温度(θ₀)、盐度(S)、海洋水平(东西向)速度(u)和海洋垂直(南北向)速度(v)。这些变量在垂直方向上被离散化为 19 个深度层。
  • 二维变量: 海表面高度(SSH)。
  • 大气边界条件: 包括海洋表面东西向应力(Tu)、海洋表面南北向应力(Tv)、通过海洋表面的净热通量(Q)及其异常(Qanom)。

在数据预处理阶段,研究人员 将原始数据在时间和空间上进行粗化,并使用高斯滤波器进行平滑处理,然后将其插值到一个 1°×1° 的全球经纬度网格上。

模型组成#

Samudra 模拟器是一个自回归模型,其目标是根据之前的海洋状态和大气边界条件,预测未来的海洋状态。具体来说,他们 使用了两种模型配置:

  • 完整模型 (Fthermo+dynamic): 使用所有变量(θ₀、S、SSH、u、v)作为输入和输出。
  • 热力学模型 (Fthermo): 仅使用热力学变量(θ₀、S、SSH)作为输入和输出。

模型在训练过程中,会接收当前海洋状态、之前海洋状态和大气边界条件作为输入,输出未来两个时间步长的预测结果。这种多步输入输出配置有助于模拟海洋过程的时间依赖性。

模型架构#

Samudra 模拟器的核心架构是改进的 ConvNeXt UNet,该架构采用了ConNeXt块来提高特征提取能力,同时利用了 UNet 的下采样和上采样结构来实现多尺度特征学习。该架构还包含扩张卷积和反向瓶颈通道来提高计算效率。

模型训练和评估#

研究团队 使用 1975 年至 2014 年的OM4数据训练和验证模拟器,其中 1975 年至 2012 年的数据用于训练,2012 年至 2014 年的数据用于验证。为了避免因模型从初始状态调整而引起的冷却偏差,他们 忽略了 1958 年至 1975 年的数据。研究人员 使用 Adam 优化器和余弦学习率调度器来训练模型。

为了评估模拟器的性能,研究团队使用2014年的初始状态和2014年至2022年的大气边界条件进行8年的模拟,并将模拟结果与OM4的保留数据进行比较。

结果#

1. 全深度全球海洋模拟器

Samudra 模拟器能够精确地再现海洋变量的全深度气候学剖面,包括潜在温度的深度结构、副热带环流和北极深水形成的区域等关键特征。同时,模拟器在再现热跃层结构方面表现出良好的能力。

此外,该模拟器还能够再现关键的年际变率模式,例如厄尔尼诺-南方涛动 (ENSO),并能模拟不同时期厄尔尼诺事件的特征,包括热带地区表层温度的异常变化和赤道温跃层的加深和变浅。

在灵敏度测试中,研究人员 发现模拟器的性能对训练模型的随机种子和初始条件的改变具有鲁棒性,这表明了该模型具有较强的泛化能力。

2. 长期稳定性

为了评估 Samudra 模拟器的长期稳定性,研究团队进行了长达 100 年的控制实验,并重复使用 1990 年至 2000 年的大气边界条件。结果表明,模拟器能够保持长期稳定性,并且能够收敛到接近于 OM4 模型的全局平均潜在温度。这表明该模拟器具备运行长期气候模拟的潜力。

值得注意的是,Fthermo 模拟器在长时间尺度上表现出更显著的非周期性变化,这可能是由于其模型结构不依赖于动态变量而导致的。

讨论#

Samudra模拟器是一种计算效率高、性能强大的海洋模拟器,与传统的 OM4 模型相比,它在计算效率方面取得了巨大的突破,并且能够精确地再现海洋变量的气候学特征和年际变率。例如,Samudra 的热力学模型 (Fthermo) 的计算效率极高,比传统海洋模型快 150 倍。使用单个 40GB A100 GPU 运行 100 年的模拟仅需约 1.3 小时,而 OM4 模型则需要 4671 个 CPU 核心运行约 8 天的时间。 这种巨大的速度提升为大规模气候模拟和参数敏感性研究提供了前所未有的便利。

然而,Samudra 模拟器在捕捉气候变化趋势方面仍然存在不足,这可能与训练数据的限制、大气边界条件的简化、模型结构的局限性以及训练数据的固有偏差有关。未来的研究将致力于解决这些问题,并提高模拟器在预测未来气候变化趋势方面的能力。

相关链接#

本公众号相关内容推荐#

Samudra: 一个用于气候研究的全球海洋AI模拟器
https://blog.scidatalab.net/posts/samudra-一个用于气候研究的全球海洋ai模拟器/
作者
Echo
发布于
2024-12-26
许可协议
CC BY-NC-SA 4.0