整个训练过程是在 64 个 Nvidia A100 GPU 的集群上完成 , 端到端训练大约需要 16 小时 。
降水模型
ERA5 re-analysis 数据集中的总降水量(total precipitation , TP)是一个变量 , 表示通过降雨和降雪落到地球表面的累积液态和冰冻水 。 该研究将总降水量作为诊断变量 , 并用 p(kΔt) 表示 。 用于训练主干模型的数据集(20 个变量)不包括总降水量这个变量 。 相反 , 研究者训练一个单独的 AFNO 模型, 使用主干模型输出来诊断 T P , 如图 2(c) 所示 。 这种方法将降水建模的困难与预测大气状态的一般任务脱离 。 此外 , 一旦经过训练 , 诊断 TP 模型可能会与其他预测模型(传统的 NWP 或数据驱动的预测)结合使用 。
文章图片
用于从主干输出诊断降水的模型具有相同的基本 AFNO 架构 , 此外还具有额外的 2D 卷积层和 ReLU 激活 , 用于强制执行非负降水输出 。 由于主干模型以 6 小时为增量进行预测 , 因此该研究训练诊断降水模型来预测 6 小时累积的总降水量 。
实验结果
下图1定性地展示了 FourCastNet 模型以 0.25°-lat-long 的分辨率预测全球地表风速的能力 。 其中 , 使用风速的纬向和经向分量计算地表风速的大小 , 即
文章图片
。
下图1显示了使用FourCastNet生成的提前96小时的说明性全球近地表风速预测 。 研究者重点介绍了预测的已解析和准确跟踪的关键高分辨率细节 , 包括超级台风山竹(Mangkhut , 2018年)和向美国东海岸进发的三个命名气旋(Florence、Issac和Helene) 。
其中 , 图 1(a) 显示了模型初始化时的风速 。 图 1(b) 显示了提前 96 小时的模型预测(上)和当时相应的真实风速(下) 。 可以看到 , FourCastNet 模型能够提前 96 个小时预测风速 , 并且具有出色的保真度和正确的精细尺度(fine-scale)特征 。
文章图片
值得注意的是 , 图1说明了一个名为山竹的超级台风的形成和轨迹的预测情况 , 该台风在大约 10° N、210° W 的初始位置开始形成 。 该模型以惊人的保真度定性地预测了该台风的增强及其在 4 天内的轨迹 。 这表明 FourCastNet 模型能够很好地预测台风等天气现象的形成和移动轨迹 。
该研究使用来自样本外测试数据集的初始条件初始化 FourCastNet 模型 。 基于此初始条件 , 模型可以在推理模式下自由运行 16 个时间步长 , 如下图 2(d) 所示 。
文章图片
相比于台风 , 降水存在间歇性和随机性 , 因此预测降水被认为是一项极其困难的任务 。 下图 3 展示了 FourCastNet 模型预测全球总降水量的能力 。 图 3(a) 为初始化的降水条件 , 图 3(b) 是提前 36 个小时的模型预测和实际情况的对比 。 该图以美国西海岸局部区域的降水为例 , 突出了 FourCastNet 模型以极高的精度解析和预测局部降水的能力 。 研究者观察到 FourCastNet 在捕获短期高分辨率降水特征方面性能出色 , 这对预测极端天气事件具有重大意义 。 值得注意的是 , 这是第一次成功利用深度学习模型进行大规模降水预测 。
文章图片
接下来 , 研究者进一步探讨了开发深度学习模型来预测飓风的潜在效用 。 飓风作为一种具有巨大破坏潜力的极端天气事件 。 构建快速可用、计算成本低廉的大气预警模型对于减轻生命和财产损失损失非常重要 , 同时这类模型也需要更严格的要求以避免错误预测 。 下图 4 展示了 FourCastNet 在预测迅速多变的飓风方面的强大能力 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
