Blog GribStream

ERA5 arriva in GribStream come valori reali meteo

|

GribStream sta integrando la reanalisi ECMWF ERA5 a livello singolo come valori reali orari su griglia globale da 0.25 gradi, con copertura iniziale dal 2020 e storia più antica in fasi successive.

GribStream sta integrando ECMWF ERA5 come dataset di valori reali per orario di validità nell'API pubblica. Gli utenti possono consultare ERA5 con lo stesso workflow di serie temporali usato per le previsioni, ma interpretando ogni riga come un campo di reanalisi al suo orario di validità, non come una previsione con lead time.

Questo conta perché ERA5 non è semplicemente un altro feed di modello. È la quinta generazione della reanalisi globale ECMWF, prodotta per il Copernicus Climate Change Service, e l'archivio sorgente risale a gennaio 1940. ERA5 combina osservazioni storiche con un sistema fisso di modello e assimilazione ECMWF per costruire un registro su griglia dell'atmosfera, della superficie terrestre e di variabili climatiche correlate.

Perché ERA5 conta

Gli archivi di previsioni operative sono essenziali, ma da soli non sono un riferimento storico stabile. I sistemi di previsione cambiano, i pacchetti fisici vengono aggiornati, l'assimilazione dei dati evolve e i formati di consegna cambiano. Se addestri un modello o verifichi un prodotto su molti anni, queste discontinuità possono mescolarsi al segnale misurato.

ERA5 riduce il problema rianalizzando il passato con un sistema coerente. Le osservazioni vengono integrate con la fisica del modello tramite assimilazione dati per produrre campi globali orari completi. Resta una reanalisi, non una rete di stazioni, quindi i cambiamenti nel sistema osservativo e la rappresentatività locale contano ancora. Ma come riferimento pubblico per valori reali su griglia, verifica delle previsioni, backtesting ed etichette di machine learning, ERA5 è una delle basi più utili.

Come GribStream espone ERA5

In GribStream, ERA5 usa semantica di valori reali per orario di validità:

  • forecasted_at è uguale a forecasted_time
  • horizon = 0
  • member = 0
  • coordinate, variabili, alias, CSV, JSON e NDJSON funzionano come nel resto dell'API

Questo rende ERA5 facile da combinare con IFS Oper, IFS ENS, AIFS Oper e altri dataset di previsione. Un workflow di verifica può chiedere la previsione e poi il valore reale ERA5 con gli stessi selettori di coordinata e parametro.

Nell'API, questo significa che ERA5 non richiede un percorso di integrazione separato. Puoi riutilizzare liste di coordinate, selettori di variabili, alias, CSV, JSON e NDJSON per verifica, label, backtest e dashboard.

Il riferimento pratico è l'API pubblica con il catalogo. Usa il catalogo per vedere quali variabili ERA5 sono disponibili ora, e aspettati che l'elenco cresca man mano che validiamo altri campi e i clienti chiedono maggiore copertura.

Variabili iniziali

La prima pubblicazione ERA5 è volutamente mirata. Copre campi a livello singolo di alto valore sulla griglia globale latitudine/longitudine da 0.25 gradi del CDS:

  • temperatura e umidità vicino alla superficie: 2t, 2d
  • vento: 10u, 10v, 100u, 100v
  • pressione: sp, msl
  • nuvolosità e acqua in colonna: tcc, tcw, tcwv
  • precipitazione e neve: tp, sf, sd
  • radiazione e stato della superficie: ssrd, strd, skt

Questo insieme copre molti workflow comuni: errore di temperatura, verifica del vento, feature solari e di energia superficiale, etichette per neve e precipitazione, campi di pressione, filtro nuvolosità e contesto di vapore acqueo.

Piano di caricamento storico

L'archivio ufficiale ERA5 è troppo grande per essere trattato come un unico lancio. GribStream lancia ERA5 con copertura dal 1 gennaio 2020. Gli anni precedenti potranno essere aggiunti più avanti se la domanda dei clienti giustificherà i costi aggiuntivi di storage e backfill, senza rimandare l'accesso fino al mirror completo del registro 1940-presente.

Questo rilascio graduale è intenzionale. ERA5 è grande, e il valore maggiore è rendere disponibile prima un archivio affidabile di valori reali recenti, poi estendere la storia e aggiungere variabili quando la domanda dei clienti lo giustifica.

Anche i dati ERA5 più recenti hanno una cautela. Copernicus pubblica i campi recenti come ERA5T, di solito circa cinque giorni dopo il tempo reale, e poi li sostituisce con ERA5 finale, tipicamente due o tre mesi dopo il mese in questione. Per le date più nuove, tratta ERA5 come reanalisi quasi in tempo reale finché il prodotto finale non sostituisce ERA5T.

Dove si inserisce

ERA5 è la scelta migliore in GribStream quando la domanda è "cosa è successo sulla griglia?" e non "cosa prevedeva un modello?". È particolarmente utile per:

  • verifica delle previsioni rispetto a output ECMWF, NOAA e modelli IA
  • etichette di machine learning per temperatura, vento, precipitazione, solare, neve e nuvole
  • pipeline di correzione bias e calibrazione
  • backtesting di impatto meteo per energia, agricoltura, logistica, assicurazioni ed eventi
  • unione di valori reali e archivi previsionali con la stessa struttura API

La pagina modello è disponibile su ERA5, e il catalogo mostra la finestra attualmente disponibile man mano che il caricamento storico avanza.

Letture correlate

Fonti