上线欧洲气象中心官网、台风杜苏芮复盘:盘古气象大模型近况更新

这是我在知乎上写的第三篇关于盘古气象大模型的文章了,前两篇文章如下:

近期有两件事值得更新,所以我决定再写一篇文章。

欧洲气象中心正式发布盘古测试报告

先来个开胃菜。7月19日,欧洲气象中心(ECMWF)在预印本网站arXiv上发布了一篇文章:

文章题为《The rise of data-driven weather forecasting》,可以翻译为《数据驱动的气象预报方法的崛起》。文章的署名者既包括之前与我们联系的Matthew Chantry(Nature文章的第二个审稿人),也包括ECMWF的执行总裁Florian Pappenberger等人。因此,相比于之前的演讲PPT,这篇文章要正式得多。

文章先是仔细调研了最近出现的一批AI气象预报方法,包括(按时间顺序排列)英伟达FourCastNet、华为盘古、谷歌GraphCast、浦江风乌(也许因为时间太近,期智伏羲没有被包含进去),指出这些近期发布的AI模型,得到了让人印象深刻(impressive)的结果,甚至能与ECMWF的高分辨率数值模式对比。可以看出,ECMWF对于这一发展感到意外,因为它动摇了ECMWF的统治地位。

除了调研外,ECMWF还充分测试了盘古在各个场景下的预报结果,因此这篇文章可以视为权威气象机构出示的盘古测试报告。文章显示,在大部分场合下,盘古的精度均优于ECMWF的集成预报系统(IFS)。值得注意的是,ECMWF在测试盘古模型时,直接用了IFS零场数据,这与盘古的训练数据(再分析场)有差异,因此盘古的精度会低于Nature论文里报告的精度。此外,ECMWF用于对比的数值模式,分辨率高于盘古模型(盘古无法获取高分辨率数据),所以盘古会略微吃亏一些。

在报告的最后,作者们展望道:

翻译:在实操环境中,对基于机器学习的预报算法进行的首次评估,显示出非常有希望的结果。机器学习模型在数值天气预报系统中的未来作用,以及这种方法对于物理模型能力的互补性,仍有待进一步探索。预报中心应该探索这些模型的优点和缺点,作为其预测系统的附加组件:以更高速度和更低计算成本运行预报的能力,(为气象预报)开辟了新的视野。

也就是说,ECMWF也认为,AI方法应该与数值模式深度结合起来。

盘古预报上线欧洲气象中心

第一件事是欧洲气象中心(ECMWF)将盘古气象大模型上线到官网,作为他们日常发布预报结果的一部分。这样,全世界的气象爱好者不用自己搭建环境,就可以在ECMWF网站上直接查看盘古的结果了。

使用方法:登陆https://charts.ecmwf.int/,在左边导航栏中搜索PANGU或者勾选Machine learning models,就可以看到一系列盘古的预报入口,截图如下:

图1:在ECMWF charts上搜索PANGU得到的结果

此时可以查看感兴趣的气象要素。如果对台风感兴趣,一般可以查看第一个,即Mean sea level pressure and 850 hPa wind speed,其中Mean sea level pressure(平均海平面气压)可以作为判定台风的主要标准,因为台风是个低压系统,对应于平均海平面气压的极小值。进入第一个入口后,左侧区域选择South East Asia & Indonesia,以观测我国东南沿海附近的台风。截图如下:

图2:ECMWF提供的盘古预报,可见今年6号台风卡努登陆长三角的情况

在选择一个起报时刻(每天UTC的0点和12点,但是上线时间一般会晚几个小时)以后,再选择想要看的预报时刻,就可以看到结果了。上图所示,在7月29日12UTC,盘古预测卡努大约在8月2日18UTC(即北京时间8月3日凌晨2点)登陆长三角。当然,随着时间的推进,预报结果也会发生变化。

近来,国内有许多爱好者已经关注到盘古大模型。在B站和百度台风吧里,出现了越来越多分享盘古预报结果的视频和帖子,当然这与近期台风密集登陆我国有关。我在B站搜索“盘古 台风”,得到的结果如下:

图3:B站上,气象爱好者发布了许多盘古预报台风的视频

这种趋势既让我们欣喜,也给了我们一点压力,因为从今往后,盘古的预报效果会接受所有人的检验。

2023年05号台风杜苏芮情况复盘

虽然盘古团队很早就与中国气象局合作,跟踪了今年02-04号台风的全流程预报,但是05号台风是盘古大模型上线ECMWF以后,第一个预报的台风。可以说,盘古在所有爱好者的监督下,完成了这次预报。

关于盘古表现的复盘,可以关注以下视频(这个up主对于盘古的态度相对正面,他在之前的视频里,也对盘古给出了较高的评价;当然我们团队并不认识他):

关于更详细、全流程的日常路径预报,可以看看这个up主的视频(特点是不带主观评价,只整理结果):

盘古的表现分为前期和后期。

前期(7月24日之前),大部分数值模式摇摆不定,盘古坚定地预报杜苏芮会绕过吕宋岛和台湾岛,直接登陆闽粤沿海;相比而言,7月21日时,ECMWF预报杜苏芮将登陆台湾岛后二次登陆闽粤沿海;而NCEP(美国模式)则预报杜苏芮将直接北上,几乎不对大陆产生影响。最终结果表明,盘古对大趋势上的预报,比起数值模式,要更准确一些。

后期(7月24日之后),几乎所有数值模式都达成一致,修正到了杜苏芮会绕过吕宋岛和台湾岛,直接登陆闽粤沿海。此时的重点在于登陆位置。数值模式预报的登陆点偏北,大致在福建厦门漳州一带;而盘古则在较长时间内,坚持预报登陆位置在广东潮汕一带,后续逐渐调整至福建东山,最终调整至福建厦门。也就是说,盘古对登陆点的预报,比起数值模式,要更不准一些。

当然,在杜苏芮这个个例上,盘古是否超过了ECMWF,不同人会有不同的看法。如果关注整体趋势,那么盘古更早得到正确路径,“大局观”更好;如果关注登陆位置,那么盘古更晚修正至厦门,“细节”稍差。这种结果略微出乎我们的预料。按理说,前期数值模式分歧较大,而后期数值模式分歧较小,这说明前期预报难度要大于后期。也就是说,盘古做对了难题却没做好简单题。有意思的是,英伟达FourCastNet(也已上线ECMWF官网)的性质,跟盘古很类似!我们分析以后,认为问题可能出在初始场上。盘古和FourCastNet的训练数据来自再分析场,而测试数据则是直接来自IFS零场[1],两者的数据分布存在一定的差异。这种差异,可能给AI方法带来了某种系统误差,使得预报的登陆点一直偏西。我们希望能尽快弥补这个缺陷。

此外,正如我们论文里所写的那样,AI方法对于台风强度的估计偏弱,这是AI方法不考虑物理规律地拟合数据、而极端天气数据占比很低的原因。因此在当前状态下,台风强度的预报,还是要更多参考数值模式。

我们将在今年06号台风卡努结束以后,再复盘它的预报结果。

参考

  1. ^注:ECMWF公开供下载的数据只包含再分析场,而再分析场有几天的延迟,所以实际预报必须使用零场。

发表回复

相关推荐

珠海長隆海洋王國超全攻略|註意事項

必帶物品:身份證、小風扇、防曬霜、遮陽傘、防曬衫(既可以防曬又可以保暖,有些館內空調很強勁)、充電寶、雨衣鞋套(質量...

· 21秒前

韩国搜索引擎网站NAVER保姆级注册教程

NAVER(韩语:네이버)是Naver公司旗下韩国著名搜索引擎网站,其Logo为一顶草帽,于1999年6月正式投入使用。它使用独有的搜 ...

· 21秒前

拓扑结构

什么是拓扑结构?   首先我们来解释一下拓扑的含义,所谓“拓扑”就是把实体抽象成与其大小、形状无关的“点”,而把连接实体的 ...

· 1分钟前

森林Theforest 中文设置/联机组队/联机闪退教程

《森林》是一款描述因为空难而迷失在丛林里的幸存者主角,如何在丛林里生存和如何在野人的进攻下免遭伤害的游戏。

· 2分钟前

第一次在知乎上寫東西,記錄從事業單位辭職的過程。

2020年5月24日從今天開始,在知乎上記錄一點東西。我的愛人準備從事業編的單位辭職,趕上暴發疫情,拖瞭半年無果,她本人心情...

· 2分钟前