文章專區

2024-07-15生成式AI與傳統數值天氣預報的結合NVIDIA CorrDiff天氣降尺度模型 511 期

Author 作者 連國淵/交通部中央氣象署,專長為數值天氣預報與資料同化;劉正欽/交通部中央氣象署,專長為AI於氣象預報的應用,參與CorrDiff研發;張保亮/交通部中央氣象署,專長為氣象雷達觀測與AI於氣象的應用

輝達(NVIDIA)執行長黃仁勳今(2024)年3月在美國舉辦的GTC(GPU technology conference)大會及6月在臺灣舉辦的臺北國際電腦展(COMPUTEX)上,皆展示了一項稱為「CorrDiff」(Corrector Diffusion)的生成式人工智慧(generative artificial intelligence, generative AI)技術,並表示它可以應用於區域高解析度天氣預報上。
 
NVIDIA展示的影片(延伸閱讀1)以臺灣為例,出現雲圖、雷達回波與氣流場圖,以及臺北101等臺灣元素,並提到「目前CorrDiff是針對臺灣最佳化」,臺灣突然以一種特別的方式受到國際矚目。由於NVIDIA在發表會上並未解釋太多技術細節,因此絕大部分看到相關消息的人應該很難理解此項技術到底是什麼、應用方式為何,以及此技術研發工作與臺灣負責天氣預報的中央氣象署(簡稱氣象署)是否有關聯?本文將試著由氣象研究者的角度回答上述問題,並簡介當今蓬勃發展的AI技術進入天氣預報領域的現況與未來展望。
 

傳統的數值天氣預報

談到天氣預報議題,我們需要先了解「傳統」的數值天氣預報(numerical weather prediction, NWP)。它是基於物理模式,包含流體力學偏微分方程式與對大氣物理過程的描述,依賴高速運算電腦進行數值模擬的天氣預報技術。此外,為獲得當下真實的大氣狀態以作為模擬的初始條件,數值天氣預報技術的範疇,還包含現地觀測、人造衛星、氣象雷達等對地球大氣、海洋狀態的觀測,以及將觀測資料最佳化運用於預報模式中的資料同化(data assimilation)技術等。
 
數值天氣預報在過去70年持續穩定發展、進步,曾被譽為氣象預報的寧靜革命。現今大眾每日接收的天氣預報,其中的基礎來源資料幾乎全都來自於世界上幾個先進的數值天氣預報中心,包括美國國家環境預報中心(National Centers for Environmental Prediction, NCEP)、歐洲中期天氣預報中心(European Centre for Medium-Range Weather Forecasts, ECMWF)等。而氣象署除了參考上述國際先進單位的預報資料之外,也發展自己的數值天氣預報系統,以提供更適切、在地化的臺灣天氣預報。
 

當機器學習、AI加入天氣預報模型開發

奠基於神經網路(neural network)等機器學習(machine learning)技術的建模方法,長年應用於天氣預報中,協助天氣預報系統的運行。但過去的氣象科學家們大多認為,此類技術僅適合運用於數值天氣預報流程的前端或後端,不考慮以機器學習模型代替核心的物理模式〔註〕。然而,近幾年機器學習及AI技術進展突飛猛進式,強力挑戰了數值天氣預報這道鴻溝。到目前為止最引人注目的突破是自2022年起多個運用最新AI/機器學習技術的模型,例如NVIDIA的FourCastNet、Google的GraphCast、華為的Pangu-Weather等,展現了相當於當今最佳的傳統數值天氣預報模式,甚至有略微超越的全球天氣預報能力。於是人們開始對天氣預報有了不同的想像,並構思高度依賴AI模型做天氣預報的可能性。
 

〔註〕因為這類地球物理流體力學問題的維度非常巨大,過去未曾看過可以與物理模式比擬的技術。

 
此議題仍在快速進展,但由於這類型的天氣預報模型皆仰賴由傳統數值天氣預報技術產製的全球大氣歷史「再分析」(reanalysis)資料作為訓練資料,且需使用傳統數值天氣預報系統的即時分析資料作為它的初始條件,因此它目前仍無法脫離傳統技術獨立運作。合理的展望是這些強大的新興技術很快就會(或已經)進入天氣預報應用中,與傳統數值天氣預報技術相輔相成地發展,而提供訓練資料將是傳統數值天氣預報技術的其中一項重要角色。
 

氣象模擬中的降尺度技術

對於氣象模擬與預報來說,縮小網格解析度一直是一大挑戰。傳統物理模式受限於運行時所需的龐大運算量,當今執行全球預報的最高解析度模式為ECMWF的九公里解析度全球模式。而新興AI技術全球預報模型的解析度幾乎都是約25公里,原因是它們所用的訓練資料都是一組稱為「ERA5」(ECMWF Reanalysis v5),解析度為0.25度的全球大氣再分析資料。這樣的解析度對預報全球大範圍天氣變化趨勢來說已足夠,但對於中小尺度的劇烈天氣現象,例如颱風、鋒面、對流降雨系統來說,仍然遠遠不夠。此外,也不足以用來解析天氣系統與複雜地形的交互作用,而這些正是要做好臺灣這類小區域天氣預報的關鍵。
 
為此,科學家需要透過「降尺度」(downscaling)技術以在有限區域中獲得解析度更高、更精細的氣象模擬資料。傳統的降尺度方法包括「統計降尺度」(statistical downscaling)與「動力降尺度」(dynamical downsacling)。其中,統計降尺度通常利用長期的歷史模式資料(解析度較低)與實際觀測資料(解析度較高)建立起兩者間的統計關係,便可在之後的模擬中推估相應的高解析度變數。而動力降尺度則是以傳統物理模式進行模擬,但使用配置在特定目標區域的高解析度區域模式,它的模擬初始條件和側邊界條件〔註〕則由較低解析度的全球模式輸出資料而來。透過區域模式具備的高解析度動力與物理過程,以及高解析度地形與地表狀態資料等,有機會得到更接近真實的高解析度區域氣象模擬資料。
 

〔註〕模式模擬範圍的側邊四面,自模擬時間開始至結束的大氣狀態資料。

 
若將動力降尺度方法應用於即時天氣預報,則輸入資料為即時的全球數值天氣預報,輸出則為解析度約1∼5公里等級的區域數值天氣預報資料,可掌握中小尺度天氣變化與極端值,提供對此區域範圍內更精細的氣象預報資料。然而因動力降尺度方法是以物理模式進行高解析度的數值模擬,它所需的計算資源和全球數值天氣預報一樣相當龐大,需在大型高速運算電腦上運行。此外,由於預報的初始條件來自較低解析度的全球初始資料,我們還是可以預期在初期此預報對中小尺度天氣演變的掌握度仍不夠好。
 

氣象署RWRF區域高解析度資料同化與預報系統

氣象署發展的「RWRF」(Radar WRF)高解析度極短期劇烈天氣預報系統(延伸閱讀2),可提升對臺灣區域劇烈天氣的預報能力。此系統奠基於美國國家大氣研究中心(National Center for Atmospheric Research)的「WRF」(Weather Research & Forecasting)數值天氣預報模式與它的資料同化系統(WRFDA),再由氣象署針對臺灣本地需求修改發展,自2016年起開始作業運作。
 
RWRF系統的模式解析度為兩公里,涵蓋範圍如圖一所示。它能運行區域高解析度的快速更新循環資料同化,將高解析度的即時觀測資料運用於區域模式中,藉此得到區域範圍內更準確的分析與短期預報資料,比單純的動力降尺度預報更為複雜。其中,資料同化使臺灣區域的氣象雷達觀測資料每半小時進入此模式中、地面氣象站觀測資料(包含人工和自動氣象站)每一小時進入模式中。RWRF系統以每小時的更新頻率提供13小時長度的預報資料,作為署內預報中心與民航局等相關政府單位的參考。
 

圖一:2021年9月11日23時,RWRF系統對璨樹颱風的模擬雷達回波(色階)與地面風場(風標)分析資料。(作者提供)

 
RWRF系統針對臺灣區域發展,是此區域高解析度網格氣象分析以及短期預報資料的重要來源。而在近年AI天氣預報研究快速崛起之際,此系統累積的歷史分析也成為相當寶貴的資料。

NVIDIA CorrDiff技術

NVIDIA企望能將最新的AI及軟硬體技術推廣應用於各個科學研究領域,其中也包括天氣預報領域。而本文介紹的CorrDiff模型,就是將AI技術中的超解析度(super resolution)技術應用於氣象模擬的降尺度問題的創新應用,嘗試以AI來應對氣象模擬對解析度的需求,藉由輸入解析度較低的全球模式預報資料,產生區域高解析度預報。
 
自2022年開始,氣象署與NVIDIA在天氣預報相關領域的多項議題上展開合作。在CorrDiff模型的研發工作中,氣象署收集並整理2018年1月∼2022年4月的RWRF兩公里解析度氣象分析資料,作為相當重要的訓練資料集,提供NVIDIA進行研發。並在過程中協助氣象資料解讀、傳統數值天氣預報技術諮詢,以及天氣預報實務需求的經驗分享等。
 
根據NIVIDA發表的CorrDiff預印本論文(延伸閱讀3),我們可以知道此模型在訓練過程中採用的輸入資料為ERA5全球約25公里解析度再分析資料(僅擷取與RWRF範圍相近的臺灣鄰近範圍);而採用的輸出資料則為氣象署RWRF系統的兩公里解析度歷史分析資料,包含垂直最大雷達回波(radar reflectivity)、兩公尺高氣溫、十公尺高東西向與南北向風速等四個單層變數。在氣象署提供的四年餘的RWRF資料中,前三年被用作為訓練資料,而後面的一年四個月則是驗證資料。由此設計可知,CorrDiff模型的目標是將較低解析度(約25公里)的全球天氣預報模式資料,提升解析度成為高解析度(兩公里)的資料,並在過程中獲得對區域劇烈天氣預報重要的氣象變數──最大雷達回波、地面氣溫與風速。此工作的意義等同於氣象模擬中的降尺度,但是以資料驅動的新穎AI技術來達成。就使用長期歷史資料建立模型而論,CorrDiff可說是一種進階(AI)版的統計降尺度;但它能得到高解析度網格資料而非觀測點上的資料,以目標與效果而言比較近似於動力降尺度技術。
 
CorrDiff模型採用兩步驟來完成降尺度的計算:第一步驟是先以常應用於影像處理、能有效獲取影像特徵的UNet回歸架構,進行資料樣本平均值的修正;第二步驟則利用生成式AI中的擴散(diffusion)演算法,強化資料的高解析度細節與極值。擴散演算法透過將圖像加入雜訊,再去除雜訊的循環過程來執行,過去常應用於圖片的去噪(denoising)、修補或超解析度成像等。
 
在預印本論文中,NVIDIA指出在十公尺高風速、兩公尺高氣溫與雷達回波等氣象變數的降尺度輸出上,CorrDiff模型獲得的結果較該研究測試的其他機器學習模型更好,平均絕對誤差最小且機率預報得分最佳。進一步的校驗結果顯示,CorrDiff模型的輸出結果與ERA5輸入資料及其他機器學習模型的結果相比,具備更接近RWRF高解析度分析資料的能量頻譜特性。同時,觀察CorrDiff模型在挑選的鋒面與颱風個案中的輸出結果,可發現它確實能產生符合我們物理認知的二維氣象場型態,包括鋒面上的水平風速與溫度梯度,以及颱風眼牆附近的小範圍軸對稱高風速結構等,顯示CorrDiff模型在劇烈天氣降尺度應用中的可參考性。最後,CorrDiff模型的運算速度遠遠快於RWRF系統的數值天氣預報模式,後者需要在高速運算電腦上使用大量中央處理器(central processing unit, CPU)核心進行運算,而前者在單一圖形處理器(graphics processing unit, GPU)上即可用更短的時間完成運算,兩者的能源使用效率有天壤之別。

 

CorrDiff的應用方式與未來展望

如同NVIDIA在兩場發表會上所介紹,CorrDiff技術可望用於提升氣象模擬資料的解析度,從25公里提升為兩公里。NVIDIA冀望這套由AI全球天氣預報模型銜接AI降尺度模型的運作流程,可在較傳統數值天氣預報的計算快數千倍的基準上,提供對劇烈天氣預報與防災有用的高解析度天氣預報資料。
 
參考預印本論文中所提,未來此技術可能有以下幾種不同的應用方式:
一、由傳統全球模式數值天氣預報資料,降尺度成為高解析度預報。
二、由AI全球天氣預報模式的預報資料,降尺度成為高解析度預報。
三、氣候模擬研究(例如氣候變遷推估)上的降尺度應用,特別是用於評估未來極端天氣事件發生的機率。
四、用於與RWRF系統截然不同的其他地理區域的降尺度(可能仍需要取得對應區域的高解析度氣象資料用於模型訓練)。
 
其中,第三點與第四點的應用方式尚未直接有研究結果,仍為潛在應用,有待未來更多研究來證明與展示它的能力。
 
無論是自2022年起發表的多個AI全球天氣預報模型,或是本文介紹的CorrDiff模型,許多都以開源(open source)的方式釋出,並包含充分的說明文件。無論是氣象領域內或其他領域的個人或組織,都有能力使用這些模型來做天氣預報計算,打破了過往因技術門檻與所需的大量運算資源限制,數值天氣預報僅可能由國際上少數專責政府單位運行與發展的狀況,往後這方面的變化令人期待。氣象署也會持續跟進最新發展,並考慮運行這些開源的AI天氣預報模型,以提供例行性預報發布流程使用。
 
但一項新技術取得研究成果和實際應用在作業預報上還有一段距離。我們還需藉由長時間的分析與校驗,客觀評估此技術在真實預報應用上的表現,並累積對此預報產品特性的認識,才能使它真正在作業預報中發揮效用。另一方面,由於傳統數值天氣預報技術和AI天氣預報技術的發展應相輔相成,氣象署也仍需持續進行傳統數值天氣預報的作業與發展。例如本文介紹的CorrDiff模型發展,正突顯了氣象署多年來發展的數值天氣預報系統與累積的高品質模式資料的關鍵價值,這也是我們在這項合作中最開心的事。
 
隨著AI技術在天氣預報應用的發展,筆者認為未來傳統數值天氣預報單位需要努力的方向,包括:
一、積極了解與學習最新相關AI技術,並規劃投入發展。
二、就AI發展的取向,收集與整理各種天氣預報模式及觀測系統的長期歷史資料,開放供國際AI社群使用,促成技術創新。
三、在數值天氣預報的運作與發展可能不再僅限於少數政府單位的情況下,思考未來天氣預報工作的可能樣貌。
 
快速發展的AI技術為天氣預報領域帶來的改變可能才剛開始,期望這些相關發展最終能增進人類福祉。
 
延伸閱讀
1. NVIDIA. (Mar 19 2024). NVIDIA CorrDiff: Resolving Extreme Weather Events With Generative AI. YouTube, https://youtu.be/9vEaImsSCrw.
2. 蔡雅婷等(2019)。WRF三維變分雷達資料同化個案研究。大氣科學,47,94–119。
3. Mardani, M. et al. (2023). Residual Diffusion Modeling for Km-scale Atmospheric Downscaling. arXiv preprint arXiv:2309,15214.