GribStream Blog
ERA5-Reanalyse als Wetter-Ist-Werte in der GribStream API
GribStream bindet ECMWF ERA5-Einzellevel-Reanalyse als stündliche Ist-Werte auf einem globalen 0.25-Grad-Grid ein, mit Startabdeckung ab 2020 und älterer Historie in späteren Etappen.
GribStream bindet ECMWF ERA5 als Dataset für Wetter-Ist-Werte nach gültiger Zeit in die öffentliche API ein. Nutzer können ERA5 mit demselben Timeseries-Workflow abfragen wie Vorhersagedatasets, interpretieren jede Zeile aber als Reanalysefeld zum gültigen Zeitpunkt, nicht als Vorhersage mit Lead Time.
Das ist wichtig, weil ERA5 nicht einfach ein weiterer Modellfeed ist. ERA5 ist die fünfte Generation der globalen ECMWF-Reanalyse, produziert für den Copernicus Climate Change Service, und das Quellarchiv reicht bis Januar 1940 zurück. ERA5 kombiniert historische Beobachtungen mit einem festen ECMWF-Modell- und Assimilationssystem, um einen Gitterdatensatz der Atmosphäre, der Landoberfläche und verwandter Klimavariablen aufzubauen.
Warum ERA5 wichtig ist
Operative Vorhersagearchive sind unverzichtbar, aber für sich genommen keine stabile historische Referenz. Vorhersagesysteme ändern sich, Physikpakete werden ausgetauscht, Datenassimilation wird angepasst und Lieferformate entwickeln sich weiter. Wenn Sie ein Modell über viele Jahre trainieren oder ein Produkt verifizieren, können diese Brüche Teil des gemessenen Signals werden.
ERA5 reduziert dieses Problem, indem die Vergangenheit mit einem konsistenten System neu analysiert wird. Beobachtungen werden durch Datenassimilation mit Modellphysik verbunden, sodass vollständige stündliche globale Felder entstehen. Es bleibt eine Reanalyse und kein Stationsnetz; Änderungen im Beobachtungssystem und lokale Repräsentativität spielen weiter eine Rolle. Für Gitter-Ist-Werte, Vorhersageverifikation, klimaorientiertes Backtesting und Machine-Learning-Labels ist ERA5 aber eine der wichtigsten öffentlichen Referenzen.
Wie GribStream ERA5 bereitstellt
In GribStream verwendet ERA5 die Semantik von Ist-Werten nach gültiger Zeit:
forecasted_atentsprichtforecasted_timehorizon = 0member = 0- Koordinaten, Variablen, Aliasse, CSV, JSON und NDJSON funktionieren wie im Rest der API
Damit lässt sich ERA5 direkt mit IFS Oper, IFS ENS, AIFS Oper und anderen Vorhersagedatasets verbinden. Ein Verifikationsworkflow kann die Vorhersage und später den ERA5-Ist-Wert mit denselben Koordinaten- und Parameterselektoren abfragen.
In der API bedeutet das: ERA5 braucht keinen separaten Integrationspfad. Bestehende Koordinatenlisten, Variablenselektoren, Aliasse sowie CSV-, JSON- und NDJSON-Workflows lassen sich für Verifikation, Labels, Backtests und Dashboards weiterverwenden.
Maßgeblich sind die öffentliche API und der Katalog. Dort sehen Sie, welche ERA5-Variablen aktuell verfügbar sind; diese Liste wird wachsen, wenn wir weitere Felder validieren und Kunden mehr Abdeckung benötigen.
Erste Kernvariablen
Die erste ERA5-Veröffentlichung ist bewusst fokussiert. Sie zielt auf hochwertige Einzellevel-Felder auf dem globalen CDS-Längen-/Breitengrad-Grid mit 0.25 Grad:
- Temperatur und Feuchte nahe der Oberfläche:
2t,2d - Wind:
10u,10v,100u,100v - Druck:
sp,msl - Bewölkung und Säulenwasser:
tcc,tcw,tcwv - Niederschlag und Schnee:
tp,sf,sd - Strahlung und Oberflächenzustand:
ssrd,strd,skt
Diese Auswahl reicht für viele typische Ist-Wert-Workflows: Temperaturfehler, Windverifikation, Solar- und Oberflächenenergie-Features, Schnee- und Niederschlagslabels, Druckfelder, Wolkenfilterung und Wasserdampfkontext.
Backfill-Plan
Das offizielle ERA5-Archiv ist zu groß, um es als einmalige Veröffentlichung zu behandeln. GribStream startet ERA5 mit Abdeckung ab dem 1. Januar 2020. Ältere Jahre können später ergänzt werden, wenn Kundennachfrage die zusätzlichen Speicher- und Backfill-Kosten rechtfertigt, ohne den Zugriff bis zum vollständigen Spiegel des Zeitraums 1940 bis heute aufzuschieben.
Diese gestufte Einführung ist Absicht. ERA5 ist groß, und der höchste Kundennutzen entsteht zuerst durch ein zuverlässiges Archiv jüngerer Ist-Werte. Danach erweitern wir die Historie und zusätzliche Variablen, wenn die Nachfrage das rechtfertigt.
Für jüngste ERA5-Daten gibt es eine zusätzliche Einschränkung. Copernicus veröffentlicht aktuelle Felder als ERA5T etwa fünf Tage hinter Echtzeit und ersetzt sie später durch finales ERA5, typischerweise zwei bis drei Monate nach dem betroffenen Monat. Für die neuesten Zeiträume sollten Sie ERA5 daher als nahezu echtzeitnahe Reanalyse behandeln, bis das finale Produkt ERA5T ersetzt hat.
Wo ERA5 passt
ERA5 ist die beste GribStream-Wahl, wenn die Frage lautet: "Was ist auf dem Gitter passiert?" und nicht: "Was hat ein Modell vorhergesagt?" Besonders nützlich ist es für:
- Vorhersageverifikation gegen ECMWF-, NOAA- und KI-Modellausgaben
- Machine-Learning-Labels für Temperatur, Wind, Niederschlag, Solar, Schnee und Wolken
- Bias-Korrektur und Kalibrierung
- Wetterwirkungs-Backtesting für Energie, Landwirtschaft, Logistik, Versicherungen und Veranstaltungen
- Verbindung von Ist-Werten mit Vorhersagearchiven über dieselbe API-Struktur
Die Modellseite ist unter ERA5 verfügbar. Der Katalog zeigt das aktuell verfügbare Zeitfenster, während der Backfill fortschreitet.
Weitere Lektüre
Quellen
- ECMWF/Copernicus Knowledge Base, "ERA5: data documentation": https://confluence.ecmwf.int/spaces/CKB/pages/76414402/ERA5+data+documentation
- Copernicus Climate Data Store, "ERA5 hourly data on single levels from 1940 to present": https://cds.climate.copernicus.eu/datasets/reanalysis-era5-single-levels?tab=overview
- ECMWF, "ECMWF Reanalysis v5": https://www.ecmwf.int/en/forecasts/dataset/ecmwf-reanalysis-v5
