Blog GribStream

ERA5 arrive dans GribStream comme valeurs réelles météorologiques

|

GribStream intègre la réanalyse ECMWF ERA5 mono-niveau comme valeurs réelles horaires sur une grille mondiale de 0.25 degré, avec une couverture initiale depuis 2020 et un historique plus ancien par étapes.

GribStream intègre ECMWF ERA5 comme dataset de valeurs réelles par heure valide dans l'API publique. Les utilisateurs peuvent l'interroger avec le même workflow de séries temporelles que pour les prévisions, mais chaque ligne représente un champ de réanalyse à son heure valide, et non un lead time de prévision.

Ce point est important car ERA5 n'est pas un simple flux de modèle supplémentaire. C'est la cinquième génération de réanalyse mondiale de l'ECMWF, produite pour le Copernicus Climate Change Service, avec une archive source qui remonte à janvier 1940. ERA5 combine des observations historiques avec un système fixe de modèle et d'assimilation de l'ECMWF pour construire un enregistrement sur grille de l'atmosphère, de la surface terrestre et de variables climatiques associées.

Pourquoi ERA5 compte

Les archives de prévision opérationnelle sont indispensables, mais elles ne constituent pas à elles seules une référence historique stable. Les systèmes changent, les schémas physiques évoluent, l'assimilation de données est mise à jour et les formats de diffusion changent. Si vous entraînez un modèle ou vérifiez un produit sur plusieurs années, ces ruptures peuvent se mélanger au signal mesuré.

ERA5 réduit ce problème en réanalysant le passé avec un système cohérent. Les observations sont combinées à la physique du modèle par assimilation de données pour produire des champs mondiaux horaires complets. Cela reste une réanalyse, pas un réseau de stations, donc les changements du système d'observation et la représentativité locale comptent encore. Mais comme référence publique pour valeurs réelles sur grille, vérification de prévisions, backtesting et labels de machine learning, ERA5 est une base majeure.

Comment GribStream l'expose

Dans GribStream, ERA5 utilise la sémantique de valeurs réelles par heure valide :

  • forecasted_at est égal à forecasted_time
  • horizon = 0
  • member = 0
  • coordonnées, variables, alias, CSV, JSON et NDJSON fonctionnent comme dans le reste de l'API

Cela rend ERA5 facile à associer à IFS Oper, IFS ENS, AIFS Oper et aux autres datasets de prévision. Un workflow de vérification peut demander la prévision puis la valeur réelle ERA5 avec les mêmes sélecteurs de coordonnée et de paramètre.

Dans l'API, ERA5 ne demande donc pas une intégration séparée. Vous pouvez réutiliser vos listes de coordonnées, sélecteurs de variables, alias, sorties CSV, JSON et NDJSON pour la vérification, les labels, les backtests et les tableaux de bord.

La référence pratique est l'API publique et le catalogue. Utilisez le catalogue pour voir quelles variables ERA5 sont disponibles maintenant, et attendez-vous à ce que cette liste s'élargisse à mesure que nous validons plus de champs et que les clients demandent davantage de couverture.

Variables initiales

La première publication ERA5 est volontairement ciblée. Elle couvre des champs mono-niveau de forte valeur sur la grille mondiale latitude/longitude de 0.25 degré du CDS :

  • température et humidité près de la surface : 2t, 2d
  • vent : 10u, 10v, 100u, 100v
  • pression : sp, msl
  • nébulosité et eau intégrée : tcc, tcw, tcwv
  • précipitations et neige : tp, sf, sd
  • rayonnement et état de surface : ssrd, strd, skt

Cet ensemble couvre les usages fréquents : erreur de température, vérification du vent, variables solaires et d'énergie de surface, labels neige et précipitations, champs de pression, filtrage par nuages et contexte de vapeur d'eau.

Plan de reprise historique

L'archive officielle ERA5 est trop vaste pour être traitée comme un lancement unique. GribStream lance ERA5 avec une couverture depuis le 1er janvier 2020. Les années antérieures pourront être ajoutées plus tard si la demande des clients justifie le coût supplémentaire de stockage et de backfill, sans repousser l'accès jusqu'au miroir complet du registre 1940-présent.

Ce déploiement par étapes est volontaire. ERA5 est volumineux, et la meilleure valeur immédiate consiste à fournir d'abord une archive fiable de valeurs réelles récentes, puis à étendre l'historique et les variables lorsque la demande client le justifie.

Les données ERA5 récentes méritent aussi une précision. Copernicus publie les champs récents en ERA5T, généralement environ cinq jours après le temps réel, puis les remplace par ERA5 final, souvent deux à trois mois après le mois concerné. Pour les dates les plus récentes, il faut donc considérer ERA5 comme une réanalyse proche temps réel jusqu'au remplacement par le produit final.

Où l'utiliser

ERA5 est le meilleur choix GribStream lorsque la question est "que s'est-il passé sur la grille ?" plutôt que "qu'est-ce qu'un modèle prévoyait ?". Il est particulièrement utile pour :

  • vérifier des prévisions ECMWF, NOAA et modèles d'IA
  • créer des labels de machine learning pour température, vent, précipitations, solaire, neige et nuages
  • alimenter des pipelines de correction de biais et de calibration
  • backtester l'impact météo pour énergie, agriculture, logistique, assurance et événements
  • joindre valeurs réelles et archives de prévision avec la même forme d'API

La page du modèle est disponible ici : ERA5. Le catalogue indique la fenêtre actuellement disponible à mesure que la reprise historique progresse.

Lecture associée

Sources