今天一早,Google CEO在X上发布帖子,宣告NeuralGCM在气候建模领域取得了重大突破!“NeuralGCM将基于物理的建模与人工智能相结合,在模拟大气方面的效率比其他模型高出10万倍,为科学家提供了预测气候变化的新工具。”
这项研究成果也被刊登在了Nature上,研究团队大部分来自Google Research和DeepMind,还有MIT、哈佛和ECMWF的科学家。
论文地址:https://www.nature.com/articles/s41586-024-07744-y
Google开发的这个名为NeuralGCM的模型,能够快速、高效且准确地模拟地球大气。
其意义在于,在地球正以前所未有的速度变暖的当下,帮助科学家对地球气候做出准确的预测——
全球气温升高会使哪些地区面临长期干旱?哪些地方会因大型热带风暴而使沿海洪水更加频繁?随着气温上升,野火季节将如何变化?
面对这些亟待解决的问题,传统的基于物理的大气环流模型(General Circulation Model,GCM)显得有些捉襟见肘,GCM在面对长期天气和气候模拟时,缺乏足够的稳定性。
而NeuralGCM是一种基于机器学习的方法,结合了传统的物理建模,大大提高了模拟的准确性和效率。
这种方法生成的2-15天的天气预报比目前最先进的物理模型更准确,并且比传统的大气模型更准确地再现了过去40年的气温。
它标志着在开发更强大、更易使用的气候模型方面迈出了重要一步。
NeuralGCM模拟了2019年12月26日至2020年1月8日期间的特定湿度(specific humidity)变化模式
NeuralGCM变革气候建模
尽管传统气候模型在过去几十年中有所改进,但由于科学家对地球气候运行机制和模型构建方式的理解不完全,它们往往会产生误差和偏差。
这些模型将地球从地表到大气层的这部分空间,划分成边长为50-100公里的立方体,然后预测每个立方体在一段时间内的天气变化。
然后,模型根据公认的物理定律计算空气和水分的运动,这也就是天气预报的基本原理。
但问题在于,50-100公里这个尺度实在是太大了。
许多重要的气候过程,包括云和降水,在比当前模型使用的立方体尺寸更小的尺度上变化(毫米到公里)。
而且,科学家们对某些过程(如云的形成)的物理理解也不完整。
因此,这些传统模型不仅依赖于基本原理,还使用简化模型生成称为“参数化”的近似值来模拟小尺度和不太了解的过程。
这些简化的近似值不可避免地降低了基于物理的气候模型的准确性。
那么,NeuralGCM是怎么解决这一难题的呢?
像传统模型一样,NeuralGCM仍然将地球大气划分为立方体,并对大规模过程(如空气和水分运动)的物理进行计算。
不同的是,NeuralGCM不再依赖科学家制定的“参数化”近似值来模拟小尺度天气变化,而是使用神经网络从现有天气数据中学习这些事件的物理原理。
NeuralGCM的一个关键创新,是用JAX从头重写了大规模过程的数值求解器。
这使得研究人员能够使用基于梯度的优化,来在线调整耦合系统在多个时间步长上的“在线”行为。
相比之下,之前尝试使用机器学习增强气候模型的努力在数值稳定性方面遇到了很大困难,因为它们使用“离线”训练,忽略了随着时间积累的小尺度和大尺度过程之间的重要反馈。
将整个模型用JAX编写的另一个好处是它可以在TPU和GPU上高效运行,而传统的气候模型大多在CPU上运行。
NeuralGCM结合了传统的流体动力学求解器和用于小尺度物理的神经网络,这些组件通过一个微分方程求解器组合在一起,使系统按时间顺序推进
Google团队使用了1979年至2019年间ECMWF的天气数据,在0.7°、1.4°和2.8°分辨率下训练了一系列NeuralGCM模型。
虽然NeuralGCM是基于天气预报数据训练的,但团队设计NeuralGCM为一个通用的大气模型。
精准的天气预报和气候预测
最近的地球大气机器学习(ML)模型,包括Google DeepMind的GraphCast,已经在天气预测方面展示了革命性的准确性。
迄今为止,ML预测的研究主要集中在短期预测上,远未达到气候预测所需的数年到数十年时间。
由于数十年的气候预测难以得到可靠验证,Google团队评估了NeuralGCM在气候尺度预测方面的表现,并使用已建立的WeatherBench 2基准将其作为一个天气模型进行了评估。
NeuralGCM在0.7°分辨率下的确定性模型(deterministic model)在天气预报准确性方面与当前最先进的模型相当,天气预报准确度可达 5 天。
然而,确定性模式缺乏所需的量化不确定性,无法在较长的准备时间内做出有用的预报。
预报集合从略微不同的起始条件生成,以产生一系列同样可能的天气情况。这些集合产生的概率天气预报通常比确定性预报更准确。
NeuralGCM在1.4°分辨率下的集成模型(ensemble model),在5至15天的预测准确性方面优于之前的SOTA。
这种性能提升,得益于NeuralGCM生成的是集合天气预测,后者能和ECMWF基于物理的SOTA模型ECMWF-ENS相媲美。
在已发布的ML模型中,NeuralGCM是第一个做到这一点的。
在2至15天的预测中,NeuralGCM的集合预测有95%的时间比ECMWF-ENS更准确。
NeuralGCM在气候时间尺度预测方面,NeuralGCM也优于最先进的大气模型。
由于NeuralGCM仅模拟地球气候的大气成分,Google团队将其性能与基于物理的大气模型进行了比较。
在预测1980年至2020年间的温度时,NeuralGCM的2.8°确定性模型的平均误差,是大气模型(AMIP)误差的三分之一,即0.25 vs. 0.75摄氏度。
对比NeuralGCM和AMIP在1980年至2020年间预测1000 hPa全球平均温度的表现
由于传统的大气模型在模拟地球大气的某些方面存在困难,气候科学家有时会使用更高分辨率的模型,如X-SHiELD,这些模型虽然更准确,但计算成本较高。
与X-SHiELD相比,NeuralGCM的1.4°确定性模型在预测2020年的湿度和温度数据时误差减少了15-50%,这些数据由美国国家海洋和大气管理局(NOAA)提供。
在2020年的气候模拟期间,NeuralGCM还预测了热带气旋模式,这些模式与当年在相同区域观察到的风暴数量和强度相匹配。
NeuralGCM是第一个能够生成此类模式的基于机器学习的模型。
NeuralGCM预测了2020年全球范围内的热带气旋路径(预测的风暴数量和强度与ECMWF再分析v5(ERA5)数据集中记录的实际气旋数量和强度相匹配)
开放、快速、高效
NeuralGCM在计算速度和成本上比传统的基于物理的气候模型快了几个数量级。
其1.4°模型比X-SHiELD快3500多倍,这意味着如果研究人员用X-SHiELD模拟一年的大气,需要20天,而用NeuralGCM只需8分钟。
而且,科学家只需要一台带有单个TPU(张量处理单元,Tensor Processing Unit)的计算机就能运行NeuralGCM,而运行X-SHiELD则需要请求使用拥有13000个CPU(中央处理单元,Central Processing Unit)的超级计算机。
总体而言,使用NeuralGCM进行气候模拟的计算成本比X-SHiELD低10万倍,相当于高性能计算领域25年的进步速度。
在此图表中,NeuralGCM和两个物理模型NCAR CAM、NOAA X-SHiELD同场竞技,对比它们在30秒计算时间内生成的大气模拟天数。
这三个模型分别以不同的分辨率运行,其中X-SHiELD的分辨率最高(0.03°),NCAR CAM6的分辨率为1.0°,NeuralGCM的分辨率最低(1.4°)。
值得一提的是,尽管NeuralGCM以低分辨率运行,但其准确性与高分辨率模型相当。
那么,在准确性相当的情况下,可以看到,NeuralGCM在30s的时间内,就能够生成22.8天的大气模拟,而X-SHiELD作为一个必须在超级计算机上运行的高分辨率物理模型,则只能生成9分钟!
这也让之前因计算成本较低而颇受研究人员青睐的NCAR CAM6的优势荡然无存。
Google团队已在GitHub上公开了NeuralGCM的源代码和模型权重,供非商业用途。他们希望其他研究人员可以轻松添加新组件来测试假设并改进模型功能。
此外,由于NeuralGCM可以在笔记本电脑上运行,而不需要超级计算机的支持,因此更多的气候研究人员能够在他们的工作中使用这一最先进的模型。
结论和未来方向
NeuralGCM目前仅对地球大气进行建模,但Google团队希望最终将地球气候系统的其他方面,如海洋和碳循环,纳入模型。
通过这种方式,NeuralGCM将能够在更长的时间尺度上进行预测,不仅可以预测几天和几周的天气,还能在气候时间尺度上进行预测。
总而言之,NeuralGCM提出了一种构建气候模型的新方法,这种方法可能比现有模型更快、计算成本更低且更准确。