Question 1

Comment le quota API est-il calculé exactement ?

Accepted Answer

Les crédits sont facturés sur ce que l'API retourne réellement, pas seulement sur les heures demandées.

Credits = returned_valid_times * parameters * ceil(coordinates / 500)

returned_valid_times désigne les heures valides réellement retournées par emplacement. Pour les requêtes d'ensemble, chaque membre d'ensemble est sa propre série temporelle.

Les datasets sous-horaires sont facturés selon les heures valides sous-horaires retournées.
Les datasets à horizons dispersés ne sont facturés que pour les heures retournées.
Les requêtes servies depuis le cache sont facturées à 10 % du coût normal.

Question 2

Puis-je obtenir temporairement plus de quota pour des backfills ?

Accepted Answer

Oui. Pour un backfill important, nous pouvons configurer temporairement le quota ou le débit afin que vous puissiez extraire davantage de données sur une courte fenêtre.

Contactez info@gribstream.com avec les datasets, variables, période, nombre de coordonnées et délai cible.

Question 3

Pourquoi ai-je reçu 429 Too Many Requests, et que signifie Retry-After ?

Accepted Answer

Un 429 indique généralement un quota épuisé ou une limitation de débit en rafale. Si le quota est épuisé, Retry-After donne les secondes jusqu'à la prochaine réinitialisation quotidienne UTC. Pour la limitation en rafale, il s'agit souvent d'une pause courte. Respectez Retry-After , utilisez un backoff exponentiel avec jitter, et évitez les boucles de nouvelles tentatives serrées.

Question 4

Pourquoi mon IP a-t-elle été bloquée temporairement après du trafic 401/429 répété ?

Accepted Answer

Cela arrive quand un client continue à retenter des requêtes refusées à haute fréquence. Pour protéger la capacité partagée, GribStream peut bloquer temporairement l'IP source.

Évitez cela en corrigeant l'authentification avant de retenter des 401, en respectant Retry-After sur les 429, et en limitant les tentatives.

Question 5

Quand les quotas quotidiens sont-ils réinitialisés ?

Accepted Answer

Les quotas quotidiens sont réinitialisés à 00:00 UTC . Le compte à rebours exact est visible dans le tableau de bord de votre token .

Question 6

Quelle est la différence entre /timeseries et /runs ?

Accepted Answer

/timeseries retourne la meilleure valeur éligible pour chaque heure valide, avec le Lead Time (horizon de prévision) éligible le plus court sous vos filtres. C'est le bon choix pour des courbes de produit, tableaux de bord, variables de modélisation et backtesting basé sur les exécutions du modèle. /runs retourne toutes les valeurs correspondantes par exécution du modèle et horizon. Utilisez-le pour comparer les cycles, analyser la dérive entre exécutions ou faire de la recherche.

Question 7

Dois-je utiliser fromTime/untilTime ou timesList ?

Accepted Answer

Utilisez fromTime / untilTime pour des fenêtres denses et continues. Utilisez timesList lorsque vous connaissez déjà les horodatages exacts et voulez une extraction éparse.

Question 8

Que fait asOf et quand l'utiliser ?

Accepted Answer

asOf est une coupure par heure d'exécution du modèle pour /timeseries : seules les lignes dont forecasted_at est à cette heure ou avant sont éligibles. Il faut le lire du point de vue de l'heure d'exécution du modèle, pas comme l'heure à laquelle GribStream a indexé ou exposé les données. Utilisez-le pour du backtesting basé sur les exécutions du modèle, sans laisser entrer des cycles plus récents.

Question 9

asOf reproduit-il l'heure exacte de disponibilité dans l'API en direct ?

Accepted Answer

Non. asOf utilise l'heure d'exécution du modèle, pas l'heure exacte à laquelle une exécution est devenue disponible dans GribStream. Par exemple, une exécution GFS 12Z peut être éligible avec asOf: "12:30Z" parce que son forecasted_at est 12:00Z, même si elle n'était pas encore visible dans l'API à 12:30Z. Si vous devez approximer la disponibilité réelle de l'API dans un backtest, le flux public standard consiste à appliquer une marge conservatrice avant de définir asOf . Partez de l'heure de décision historique, retirez une estimation du retard habituel de publication et d'indexation, puis utilisez cet horodatage antérieur comme asOf . Cette marge devrait être fondée sur le retard habituel entre le cycle nominal du modèle et le moment où le fournisseur publie les horizons pertinents dans un stockage public objet/blob, avec une marge supplémentaire pour les retards occasionnels du fournisseur ou de GribStream. Sur les flux NOAA comme GFS, les fichiers sont publiés dans l'ordre des horizons de prévision : un traitement limité aux premières 48 heures de prévision peut donc souvent utiliser une correction plus petite qu'un traitement qui attend l'exécution complète. GribStream ne publie pas encore de guide de retard par dataset et par horizon sur les pages modèle ; nous prévoyons de traiter cela séparément. Vous pouvez demander l'horodatage le plus récent des lignes d'index utilisées par chaque résultat, mais ce n'est pas un journal stable de première disponibilité. Des modes expérimentaux basés sur l'heure d'indexation peuvent être disponibles sur demande, mais ils ne font pas partie du contrat stable de l'API publique.

Question 10

Pourquoi les lignes ne sont-elles pas triées par forecasted_at ou forecasted_time ?

Accepted Answer

Les réponses sont envoyées en streaming dans un ordre optimisé pour le débit. Si vous avez besoin d'un ordre déterministe, triez côté client après téléchargement.

Question 11

Comment fonctionnent les sélecteurs de variables name, level et info ?

Accepted Answer

Un sélecteur est un objet JSON exact comme { "name": "TMP", "level": "2 m above ground", "info": "" } . Copiez name , level et info depuis la page du modèle ; ce ne sont pas des libellés à traduire.

Question 12

Pourquoi ma requête sur grille ne retourne-t-elle aucun point pour ce dataset ?

Accepted Answer

La grille demandée n'intersecte probablement pas le domaine du dataset. Vérifiez la couverture du modèle, les bornes latitude/longitude et le step , puis testez une coordonnée connue dans le domaine.

Question 13

Comment fonctionnent les membres d'ensemble et quelle est la valeur par défaut ?

Accepted Answer

Pour les datasets d'ensemble, utilisez le champ members . S'il est omis, GribStream retourne seulement le premier membre disponible, généralement le membre de contrôle 0 . Ajouter des membres augmente le nombre de lignes et les crédits presque linéairement.

Question 14

Pourquoi une série temporelle avec la meilleure prévision éligible peut-elle sauter aux limites de cycle ?

Accepted Answer

Dans /timeseries , chaque heure valide utilise le Lead Time éligible le plus court. Quand l'exécution source du modèle change près d'une limite de cycle, la série peut montrer un saut. Utilisez /runs pour garder une exécution fixe du modèle.

Question 15

Comment structurer de grands backfills de façon sûre et économique ?

Accepted Answer

Pour de grands backfills, gardez des requêtes bornées et prévisibles : visez environ 10 à 15 secondes par requête, maximisez les coordonnées dans cette cible, utilisez timesList pour les horodatages épars, limitez les variables, puis faites un essai à blanc sur une petite tranche avant de passer à l'échelle.

Question 16

Comment le cache affecte-t-il le prix et la performance ?

Accepted Answer

Les hits de cache coûtent 10% des crédits normaux et sont généralement plus rapides. Le cache aide surtout pour les requêtes répétées récentes ou à faible Lead Time. Changer les coordonnées change souvent la clé de cache, et les très grandes requêtes de coordonnées ne sont pas éligibles.

Question 17

Quels headers HTTP recommandez-vous en production ?

Accepted Answer

Base recommandée : Authorization: Bearer <token> Content-Type: application/json Accept: text/csv , application/json ou application/ndjson Accept-Encoding: gzip pour les réponses volumineuses

Question 18

Comment choisir entre expressions/filtres dans l'API et post-traitement ?

Accepted Answer

Utilisez les expressions et filtres de l'API lorsqu'ils réduisent le volume renvoyé dès la requête : conversions d'unités, seuils, filtres d'événements et formules simples. Utilisez le post-traitement pour la logique à état, les jointures entre datasets, l'enrichissement externe ou les pipelines complexes.

Question 19

Puis-je utiliser GribStream pour des données météorologiques historiques et du backtesting dans une seule API ?

Accepted Answer

Oui. Utilisez /timeseries avec asOf pour reconstruire la meilleure prévision sous une coupure par heure d'exécution du modèle. Si vous devez approximer la disponibilité exacte dans l'API en direct, retirez avant de définir asOf une marge conservatrice fondée sur le retard habituel de publication du fournisseur pour les horizons utilisés. Combinez ensuite les datasets de prévision avec des datasets d'analyse ou d'observation comme cibles d'évaluation, et utilisez timesList si les horodatages d'évaluation sont épars.

Question 20

En quoi GribStream diffère-t-il du téléchargement direct de fichiers GRIB2 NOAA/ECMWF ?

Accepted Answer

Le GRIB2 brut donne un contrôle maximal au niveau des fichiers, mais vous gérez vous-même ingestion, indexation, décodage, stockage, nouvelles tentatives et disponibilité. L'API GribStream retourne seulement les variables, lieux, temps et formats nécessaires, avec beaucoup moins de charge opérationnelle.

Question 21

Comment convertir des vecteurs de vent en magnitude et direction ?

Accepted Answer

Beaucoup de modèles encodent le vent avec les composants u et v. Calculez vitesse et direction météorologique avec :

speed = math.sqrt(u*u + v*v)
direction = (270 - math.atan2(v, u) * 180 / math.pi) % 360

Dans les expressions GribStream, utilisez func.Hypot(uwind, vwind) et func.Atan2(vwind, uwind).

Question 22

Comment calculer le point de rosée depuis température Kelvin et humidité relative ?

Accepted Answer

Convertissez la température de Kelvin en Celsius et appliquez l'approximation Magnus-Tetens :

T_C = T - 273.15

a = 17.27
b = 237.7

gamma = (a * T_C) / (b + T_C) + math.log(RH / 100)
dew_point_C = (b * gamma) / (a - gamma)

Vous pouvez retourner dew_point_C ou dew_point_K comme colonnes dérivées avec les expressions GribStream.

Questions fréquentes

Compte, quota et limites

Sémantique des requêtes et sélection

Backfills et performance

Backtesting et stratégie de données

Métriques dérivées