GribStreamブログ
ERA5再解析がGribStream APIの気象実績値として利用可能に
GribStreamは、ECMWF ERA5の単一レベル再解析を0.25度全球格子の1時間ごとの実績値としてAPIに取り込んでいます。初期公開は2020年以降で、さらに古い履歴は段階的に検討します。
GribStreamは、ECMWF ERA5を有効時刻ごとの気象実績値データセットとして公開APIに組み込んでいます。利用者は、予報データセットと同じ時系列ワークフローでERA5を取得できます。ただし各行は、予報リードタイムではなく、有効時刻に対応する再解析フィールドとして解釈します。
ERA5は単なる別のモデルフィードではありません。Copernicus Climate Change Service向けにECMWFが作成している第5世代の全球再解析で、公式ソースは1940年1月までさかのぼります。ERA5は、過去の観測とECMWFの固定されたモデル・データ同化システムを組み合わせ、大気、陸面、関連する気候変数の全球格子データを作ります。
ERA5が重要な理由
運用予報のアーカイブは重要ですが、それだけでは安定した過去参照データにはなりません。予報システムは変わり、物理スキームも、データ同化も、配信形式も変わります。長期間にわたってモデルを学習したり、プロダクトを検証したりすると、そうした変更が測定したい信号に混ざることがあります。
ERA5は、一貫したシステムで過去を再解析することで、この問題を小さくします。観測はデータ同化を通じてモデル物理と統合され、1時間ごとの全球フィールドになります。もちろんERA5は再解析であり、観測ステーション網そのものではありません。観測システムの変化や、地点ごとの代表性は引き続き重要です。それでも、格子上の実績値、予報検証、バックテスト、機械学習ラベルの公開参照データとして、ERA5は非常に価値があります。
GribStreamでの扱い
GribStreamでは、ERA5を有効時刻ごとの実績値として扱います。
forecasted_atはforecasted_timeと同じですhorizon = 0member = 0- 座標、変数、alias、CSV、JSON、NDJSONはAPIの他のデータセットと同じ形で使えます
これにより、ERA5をIFS Oper、IFS ENS、AIFS Operなどの予報データセットと組み合わせやすくなります。検証ワークフローでは、同じ座標セレクタとパラメータセレクタを使って、予報と後日のERA5実績値を取得できます。
API上では、ERA5のために別の連携方法を用意する必要はありません。既存の座標リスト、変数セレクタ、alias、CSV、JSON、NDJSONのワークフローを、検証、ラベル作成、バックテスト、ダッシュボードにそのまま使えます。
実務上の基準になるのは、公開APIとカタログです。現在利用できるERA5変数はカタログで確認できます。今後、さらに多くのフィールドを検証し、顧客需要が見えてくるにつれて、この一覧は広がっていきます。
初期対象の主要変数
最初のERA5公開範囲は、意図的に対象を絞っています。CDSの0.25度全球緯度経度格子にある、価値の高い単一レベルフィールドから始めます。
- 地表付近の気温と湿度:
2t,2d - 風:
10u,10v,100u,100v - 気圧:
sp,msl - 雲量と鉛直積算水量:
tcc,tcw,tcwv - 降水と雪:
tp,sf,sd - 放射と地表状態:
ssrd,strd,skt
このセットだけでも、気温誤差、風の検証、太陽光・地表エネルギー特徴量、雪・降水ラベル、気圧場、雲によるフィルタリング、水蒸気の背景情報など、多くの実績値ワークフローをカバーできます。
バックフィル計画
ERA5の公式アーカイブは、ひとつのリリースで扱うには非常に大きいデータです。GribStreamは2020年1月1日以降の期間からERA5を公開します。さらに古い年は、追加のストレージとバックフィルのコストに見合う顧客需要がある場合に後から追加できます。1940年から現在までの全期間のミラーを待たずに、まず使える履歴を公開する方針です。
これは意図的な段階展開です。ERA5は大きいため、まず信頼できる直近履歴の実績値アーカイブを利用可能にするのが最も価値の高い進め方です。その後、顧客需要に合わせて、より古い履歴や追加変数へ広げていきます。
直近のERA5には注意点もあります。Copernicusは最近のフィールドをERA5Tとして、通常は実時間から約5日遅れで公開します。その後、対象月からおよそ2から3か月後にERA5の最終版で置き換えます。最新の日付では、最終版がERA5Tを置き換えるまで、ERA5をほぼリアルタイムの再解析として扱うのが妥当です。
どこで使うか
ERA5は、「モデルは何を予報したか」ではなく「格子上で何が起きたか」を知りたいときのGribStreamの主要な選択肢です。特に次の用途に向いています。
- ECMWF、NOAA、AIモデル出力に対する予報検証
- 気温、風、降水、太陽光、雪、雲の機械学習ラベル
- バイアス補正とキャリブレーション
- エネルギー、農業、物流、保険、イベント運用向けの気象影響バックテスト
- 同じAPI構造による実績値と予報アーカイブの結合
モデルページはERA5で確認できます。カタログには、バックフィルの進行に合わせて現在利用可能な期間が表示されます。
関連記事
情報源
- ECMWF/Copernicus Knowledge Base, "ERA5: data documentation": https://confluence.ecmwf.int/spaces/CKB/pages/76414402/ERA5+data+documentation
- Copernicus Climate Data Store, "ERA5 hourly data on single levels from 1940 to present": https://cds.climate.copernicus.eu/datasets/reanalysis-era5-single-levels?tab=overview
- ECMWF, "ECMWF Reanalysis v5": https://www.ecmwf.int/en/forecasts/dataset/ecmwf-reanalysis-v5
