Blog de GribStream

ERA5 llega a GribStream como valores reales meteorológicos

|

GribStream está incorporando el reanálisis ECMWF ERA5 de un solo nivel como valores reales horarios en una grilla global de 0.25 grados, con cobertura inicial desde 2020 y más historia en etapas posteriores.

GribStream está incorporando ECMWF ERA5 como dataset de valores reales por tiempo válido en la API pública. Los usuarios pueden consultarlo con el mismo flujo de series temporales que usan para pronósticos, pero interpretando cada fila como un campo de reanálisis en su tiempo válido y no como un lead time de pronóstico.

Esto importa porque ERA5 no es otro feed de modelo. Es el reanálisis global de quinta generación de ECMWF, producido para el Copernicus Climate Change Service, y su archivo fuente llega hasta enero de 1940. ERA5 combina observaciones históricas con un sistema fijo de modelo y asimilación de ECMWF para construir un registro en grilla de la atmósfera, la superficie terrestre y variables climáticas relacionadas.

Por qué ERA5 importa

Los archivos de pronósticos operativos son esenciales, pero por sí solos no son una referencia histórica estable. Los sistemas cambian, las parametrizaciones físicas se actualizan, la asimilación de datos evoluciona y los formatos de entrega también. Si entrenas un modelo o verificas un producto durante muchos años, esos cambios pueden mezclarse con la señal que estás midiendo.

ERA5 reduce ese problema al reanalizar la historia con un sistema consistente. Las observaciones se mezclan con la física del modelo mediante asimilación de datos para producir campos globales horarios completos. Sigue siendo un reanálisis, no una red de estaciones, por lo que los cambios en el sistema de observación y la representatividad local siguen importando. Pero como referencia pública para valores reales en grilla, verificación de pronósticos, backtesting y etiquetas de machine learning, ERA5 es difícil de reemplazar.

Cómo lo expone GribStream

En GribStream, ERA5 usa semántica de valores reales por tiempo válido:

  • forecasted_at es igual a forecasted_time
  • horizon = 0
  • member = 0
  • coordenadas, variables, aliases, CSV, JSON y NDJSON funcionan como en el resto de la API

Eso facilita combinar ERA5 con IFS Oper, IFS ENS, AIFS Oper y otros datasets de pronóstico. Un workflow de verificación puede pedir el pronóstico y luego el valor real ERA5 con los mismos selectores de coordenada y parámetro.

En la API, eso significa que ERA5 no requiere una integración separada. Puedes reutilizar listas de coordenadas, selectores de variables, aliases, CSV, JSON y NDJSON para validación, etiquetas, backtests y dashboards.

La referencia práctica es la API pública y el catálogo. Usa el catálogo para ver qué variables ERA5 están disponibles ahora, y espera que esa lista crezca a medida que validemos más campos y los clientes pidan más cobertura.

Variables centrales iniciales

La primera publicación de ERA5 es deliberadamente acotada. Apunta a campos de alto valor en la grilla global de latitud/longitud de 0.25 grados del CDS:

  • temperatura y humedad cerca de superficie: 2t, 2d
  • viento: 10u, 10v, 100u, 100v
  • presión: sp, msl
  • nubosidad y agua en columna: tcc, tcw, tcwv
  • precipitación y nieve: tp, sf, sd
  • radiación y estado de superficie: ssrd, strd, skt

Ese conjunto cubre muchos usos comunes: error de temperatura, verificación de viento, variables solares y de energía superficial, etiquetas de nieve y precipitación, presión, filtrado por nubosidad y contexto de vapor de agua.

Plan de carga histórica

El archivo oficial de ERA5 es demasiado grande para tratarlo como un único lanzamiento. GribStream lanza ERA5 con cobertura desde el 1 de enero de 2020. Los años anteriores podrán agregarse más adelante si la demanda de los clientes justifica el costo adicional de almacenamiento y backfill, sin retrasar el acceso hasta tener reflejado todo el registro 1940-presente.

Ese despliegue por etapas es intencional. ERA5 es grande, y el camino de mayor valor es publicar primero un archivo confiable de valores reales recientes, y luego extender la historia y agregar variables cuando la demanda de los clientes lo justifique.

Los datos recientes de ERA5 también tienen una salvedad. Copernicus publica los campos recientes como ERA5T, normalmente unos cinco días detrás del tiempo real, y luego los reemplaza por ERA5 final, típicamente dos o tres meses después del mes correspondiente. Para las fechas más nuevas, conviene tratar ERA5 como reanálisis casi en tiempo real hasta que el producto final sustituya a ERA5T.

Dónde encaja

ERA5 es la mejor opción de GribStream cuando la pregunta sea "qué ocurrió en la grilla" y no "qué pensaba un modelo que iba a ocurrir". Es especialmente útil para:

  • verificar pronósticos de ECMWF, NOAA y modelos de IA
  • crear etiquetas de machine learning para temperatura, viento, precipitación, solar, nieve y nubes
  • pipelines de corrección de sesgo y calibración
  • backtesting de impacto meteorológico en energía, agricultura, logística, seguros y eventos
  • unir valores reales con archivos de pronóstico mediante la misma estructura de API

La página del modelo está en ERA5, y el catálogo muestra la ventana actualmente disponible a medida que avance la carga histórica.

Lecturas relacionadas

Fuentes