Prévisions

Prévisions

Aperçu

Identification d'une incohérence linguistique et préparation d'une version anglaise améliorée

Le module de prévision de SKOOR propose des prévisions basées sur le machine learning (ML) des tendances futures à partir de données chronologiques. Quatre modèles sont disponibles :

Tous les modèles prennent en charge les séries indexées par date et heure provenant directement d'une source de données SKOOR (DataSource) ou d'une requête de données (DataQuery). 

Page de prévision

La page de prévision est divisée en deux sections. 

Page générale

Cette section comprend les paramètres des prévisions.

Screenshot 2026-04-10 at 08.27.49.png

À gauche :

Paramètre

Description

Période

La période souhaitée pour la prévision.

Activer la planification

Planification des prévisions pour automatiser les prévisions.

Configurer le modèle de prévision

Choisissez le modèle de prévision.

Configurer la définition des données

Choisissez les données pour la prévision.

Sélecteur de copie de table

Bouton permettant de copier la table contenant la prévision.

Exécuter la prévision

Exécute une prévision avec les paramètres configurés. L'état et la progression sont visibles sur la page d'exécution.

Enregistrer

Enregistre la configuration de la prévision. Si l'option de recherche d'hyperparamètres dans le configurateur de modèle est cochée, une exécution de la prévision est déclenchée automatiquement lors de l'enregistrement.

À droite se trouve l'aperçu des données de prévision sous forme de tableau. Il n'apparaît que si une prévision existe déjà.

Page d'exécution

Cette section permet d'exécuter et de surveiller les exécutions de la prévision. Elle offre un contrôle sur l'historique et permet d'obtenir des informations.

Screenshot 2026-04-10 at 08.29.06.png

Pour lancer une prévision, cliquez sur le bouton « Exécuter la prévision ». L'historique complet des exécutions peut être supprimé en cliquant sur le bouton « Supprimer l'historique des tâches ». Notez que tous les tableaux créés par les prévisions seront supprimés et que pour les récupérer, vous devrez relancer la prévision. Lorsqu'une tâche est en cours d'exécution, elle peut être annulée en cliquant sur le X rouge situé à droite de l'état affiché.

En cliquant sur une tâche, vous pouvez consulter la sortie de la console, la progression, le statut et des informations complémentaires. Dans la sortie de la console, chaque groupe et sa précision sont affichés. La précision indiquée est mesurée à l'aide du WAPE (Weighted Absolute Percentage Error), exprimée en pourcentage et calculée à partir des performances du modèle sur les données historiques.

Création d'une prévision

Une configuration de prévision peut être créée soit en cliquant sur le bouton « Plus » à gauche et en saisissant un nom, soit en important une prévision au format JSON. Une fois la configuration de prévision créée, quelques paramètres doivent être définis sur la page « Général ».

Configuration du modèle

Cliquer sur le bouton « Configurer le modèle de prévision » ouvre une boîte de dialogue dans laquelle le modèle peut être sélectionné. Actuellement, il existe 4 options de modèle différentes, présentées ci-dessous. Certains modèles disposent d'un bouton d'optimisation des hyperparamètres qui permet au modèle de tester différentes combinaisons d'hyperparamètres afin de trouver la meilleure. Les différents hyperparamètres pouvant être définis sont répertoriés sous le modèle. Si la recherche d'hyperparamètres a déjà été lancée, vous pouvez afficher et copier les hyperparamètres en cliquant sur le bouton « Afficher les hyperparamètres optimisés ».

Une fois que vous avez terminé de définir les hyperparamètres, cliquez sur Enregistrer pour enregistrer la configuration du modèle ou sur Annuler pour annuler les modifications.

Screenshot 2026-04-10 at 08.31.32.png

Les modèles suivants sont disponibles :

Prophet

  • Prophet est un outil open source basé sur l'apprentissage automatique, développé par Meta (anciennement Facebook) pour la prévision de données de séries chronologiques. Il est conçu pour résister aux données manquantes et aux changements de tendance, et excelle particulièrement dans la prévision de séries chronologiques présentant une forte saisonnalité. Prophet peut gérer automatiquement les effets liés aux jours fériés et permet à l'utilisateur de définir ses propres hyperparamètres pour le rendre encore plus précis.

  • Prophet est l'option la plus largement utilisée parmi celles disponibles, car son apprentissage prend un temps modéré mais il fournit systématiquement les meilleurs résultats, ce qui en fait le choix le plus rentable dans la plupart des scénarios. Prophet excelle lorsqu'on lui fournit plusieurs saisons de données dans lesquelles se produisent des effets saisonniers récurrents, des effets liés aux jours fériés ou des changements de tendance irréguliers.

  • Lorsqu'il est sélectionné, le modèle Prophet affiche également des intervalles de confiance, qui indiquent le degré de certitude du modèle dans ses prévisions. Lorsqu'il est visualisé sur le tableau de bord, l'intervalle de confiance apparaît en couleur claire autour de la prévision.

    Screenshot 2026-04-10 at 08.22.01.png

Les variables suivantes peuvent être configurées :

Paramètre

Description

seasonality_mode

Détermine si les effets saisonniers sont ajoutés à la tendance ou multipliés par celle-ci. Par défaut : additive. Paramétrable.

yearly_seasonality

Active, désactive ou détecte automatiquement l'ajustement d'un modèle saisonnier annuel. Par défaut : auto

weekly_seasonality

Active, désactive ou détecte automatiquement l'ajustement d'un modèle saisonnier hebdomadaire. Par défaut : auto

daily_seasonality

Active, désactive ou détecte automatiquement l'ajustement d'un modèle saisonnier quotidien. Par défaut : auto

interval_width

Largeur de l'intervalle d'incertitude renvoyé avec chaque prévision. Par défaut : 0.8, plage : 0,1–1,0.

mcmc_samples

Nombre d'échantillons MCMC pour une inférence bayésienne complète ; la valeur 0 utilise à la place l'estimation MAP. Par défaut : 0

changepoint_prior_scale

Contrôle la flexibilité de la tendance aux points de changement ; des valeurs plus élevées permettent des changements de tendance plus marqués. Par défaut : 0.05, plage : 0,001–0,2. Paramètre ajustable.

seasonality_prior_scale

Force de régularisation pour les composantes de saisonnalité ; des valeurs plus élevées permettent des fluctuations saisonnières plus importantes. Par défaut : 10.0, plage : 0,0–20,0. Entraînable.

holidays_prior_scale

Contrôle l'ampleur des effets des jours fériés sur la prévision. Par défaut : 10.0, min : 0,0.

changepoint_range

Fraction de l'historique d'apprentissage dans laquelle des points de changement de tendance sont autorisés. Par défaut : 0.8, plage : 0,0–0,95. Paramétrable.

n_changepoints

Nombre de points de changement de tendance potentiels automatiquement placés dans la période d'apprentissage. Par défaut : 25, plage : 0–100. Paramètre d'apprentissage.

uncertainty_samples

Nombre d'échantillons a posteriori utilisés pour estimer les intervalles d'incertitude des prévisions. Par défaut : 1000, min : 0.

SARIMAX

  • SARIMAX (Seasonal Autoregressive Integrated Moving Average with Exogenous Regressors) est un modèle statistique utilisé pour prédire des valeurs futures à partir de données passées. Il prend en compte à la fois les tendances et les variations saisonnières. Il s'agit d'une extension du modèle ARIMA par l'ajout de composantes saisonnières.

  • Le modèle SARIMAX est particulièrement efficace lorsque les données générées sont stables et cohérentes et qu'un modèle statistique est préféré à un modèle d'apprentissage automatique.

Le modèle SARIMAX ne comporte aucune variable pouvant être ajustée par l'utilisateur.

Régression linéaire

  • La régression linéaire est utilisée pour prédire les tendances uniquement en ajustant une ligne droite aux données d'apprentissage et en prolongeant cette ligne dans le futur. C'est un outil puissant pour prédire les tendances futures dans n'importe quelle série chronologique.

  • La régression linéaire est particulièrement adaptée lorsque les données sous-jacentes présentent une tendance linéaire claire et cohérente, avec un minimum de saisonnalité ou de bruit.

Le modèle de régression linéaire ne comporte aucune variable pouvant être ajustée par l'utilisateur.

XGBoost

  • Le modèle XGBoost utilise des arbres de décision boostés par gradient pour une prévision directe en plusieurs étapes. Avant l'apprentissage, il applique une ingénierie de caractéristiques approfondie à la série chronologique d'entrée, en extrayant des caractéristiques de décalage, des statistiques glissantes et des caractéristiques basées sur le calendrier, puis prédit chaque point futur de manière indépendante.

  • XGBoost fonctionne mieux avec des données complexes et non linéaires. Il peut atteindre une bonne précision, mais son apprentissage prend du temps et, dans certains cas, les données doivent être prétraitées séparément au préalable.

Les variables suivantes peuvent être configurées :

Paramètre

Description

objectif

Fonction de perte utilisée pendant l'entraînement ; détermine la métrique d'erreur que le modèle optimise. Par défaut : reg:squarederror. Paramétrable.

quantile_alpha

Niveau de quantile cible lorsque la régression quantile est utilisée comme objectif. Par défaut : 0.5, plage : 0,0 – 1,0. Paramétrable.

n_estimators

Nombre d'arbres de boosting à construire ; un nombre plus élevé d'arbres augmente la capacité mais présente un risque de surapprentissage. Par défaut : 100, plage : 5 – 2000. Paramétrable.

learning_rate

Réduction de la taille des pas appliquée après chaque arbre pour éviter le surapprentissage. Par défaut : 0.01, plage : 1e-6 – 0,5. Paramètre entraînable.

max_depth

Profondeur maximale de chaque arbre ; contrôle la complexité du modèle et l'ordre d'interaction. Par défaut : 6, plage : 3–20. Paramétrable.

min_child_weight

Somme minimale des poids d'instance requise pour créer un nœud feuille. Par défaut : 1, plage : 1–10. Paramètre entraînable.

gamma

Réduction minimale de la perte requise pour diviser un nœud ; des valeurs plus élevées rendent le modèle plus conservateur. Par défaut : 0.0, plage : 0,0–5,0. Paramétrable.

subsample

Fraction des lignes d'entraînement échantillonnées par arbre, utilisée pour réduire le surapprentissage. Par défaut : 0.8, plage : 0,5–1,0. Paramétrable.

colsample_bytree

Fraction de caractéristiques sélectionnées aléatoirement lors de la construction de chaque arbre. Par défaut : 1.0, plage : 0,5–1,0. Paramètre entraînable.

reg_alpha

Terme de régularisation L1 sur les poids des feuilles ; favorise les solutions clairsemées. Par défaut : 0.0, plage : 1e-6–10,0. Paramétrable.

reg_lambda

Terme de régularisation L2 sur les poids des feuilles ; pénalise les valeurs de poids élevées. Par défaut : 1.0, plage : 1e-6–10,0. Entraînable.

Source de données

La fenêtre de configuration de la source de données vous permet de spécifier les données utilisées pour entraîner le modèle.

La source de données peut être choisie à gauche. Il existe deux types de sources de données : une source de données provenant de votre base de données SKOOR ou une requête de données à partir de l'onglet « Data Query ». Des choix supplémentaires sont requis lors de la sélection de la source de données et peuvent être définis dans la fenêtre, tels que la source de données, la table et les colonnes. Lorsque vous sélectionnez l'option de requête de données, la requête de données doit être définie, ainsi que les colonnes de cette requête.

Screenshot 2026-04-10 at 08.30.57.png

Les colonnes de valeur, d'horodatage et de discriminateur peuvent être sélectionnées en cliquant sur le menu déroulant. Le menu déroulant affichera automatiquement les colonnes qui répondent aux exigences. Les colonnes suivantes doivent être choisies :

Paramètre

Description

Colonne de valeur

Doit contenir des valeurs numériques associées à chaque horodatage.

Colonne d'horodatage

Les données doivent être au format AAAA-MM-JJ HH:mm, et chaque groupe de données doit avoir des horodatages uniques par groupe (groupes définis par des colonnes discriminantes ou par la structure inhérente des données).

Colonnes discriminantes

Colonnes facultatives utilisées pour définir le regroupement et la hiérarchie (par exemple, pays → région → ville). Il n'y a pas d'exigences strictes en matière de données, mais l'ordre des colonnes est important, car chaque niveau affine davantage le regroupement.

Sur le côté droit de la fenêtre de données, il est possible de choisir un traitement préalable supplémentaire des données.

Paramètres

Description

Fréquence

Définit la résolution de sortie de la prévision. Plus d'informations.

Type d'interpolation

Définit la manière dont les horodatages manquants sont complétés. Plus d'informations.

Type d'agrégation

Détermine comment les valeurs multiples au sein d'une période sont combinées. Plus d'informations.

Fréquence

La fréquence détermine la sortie de la prévision. Les fréquences suivantes peuvent être choisies :

Paramètre

Description

SECONDE

Résultats de prévision avec une résolution d'une seconde.

MINUTELY

Prévisions avec une résolution d'une minute.

TOUTE HEURE

Prévisions avec une résolution horaire.

QUOTIDIEN

Prévisions avec une résolution quotidienne.

SEMAINAL_DIM

Prévisions à une résolution hebdomadaire, la semaine commençant le dimanche.

WEEKLY_MON

Résultats des prévisions à une résolution hebdomadaire, la semaine commence le lundi.

WEEKLY_TUE

Prévisions à une résolution hebdomadaire, la semaine commence le mardi.

WEEKLY_WED

Résultats des prévisions à une résolution hebdomadaire, la semaine commence le mercredi.

WEEKLY_THU

Prévisions à une résolution hebdomadaire, la semaine commence le jeudi.

WEEKLY_FRI

Prévisions à une résolution hebdomadaire, la semaine commence le vendredi.

WEEKLY_SAT

Résultats des prévisions à une résolution hebdomadaire, la semaine commence le samedi.

MONTHLY_END

Résultats des prévisions à une résolution mensuelle, ancrés au dernier jour du mois.

MONTHLY_START

Résultats des prévisions à une résolution mensuelle, ancrés au premier jour du mois.

QUARTERLY_END

Résultats des prévisions à une résolution trimestrielle, ancrés au dernier jour du trimestre.

QUARTERLY_START

Résultats des prévisions à une résolution trimestrielle, ancrés au premier jour du trimestre.

YEARLY_END

Résultats des prévisions à une résolution annuelle, ancrés au dernier jour de l'année.

YEARLY_START

Résultats de prévision à une résolution annuelle, ancrés au premier jour de l'année.

En interne, la série de données fournie est interpolée ou agrégée à la fréquence définie à l'aide du type d'interpolation et/ou du type d'agrégation. Notez que si vos données comportent des horodatages manquants ou sont trop nombreuses pour la fréquence définie, l'interpolation et/ou l'agrégation sélectionnées sont appliquées automatiquement afin de garantir une prévision fluide.

Types d'interpolation :

Paramètre

Description

Aucun

Aucune interpolation n'est appliquée, les données sont traitées telles quelles.

Linéaire

Comble les lacunes en traçant une ligne droite entre les valeurs connues.

Première

Comble les lacunes vers l'avant en utilisant la dernière valeur connue (remplissage vers l'avant).

Dernière

Remplit les lacunes vers l'arrière en utilisant la valeur connue suivante (remplissage vers l'arrière).

Spline

Comble les lacunes à l'aide d'une courbe cubique lisse ajustée aux valeurs connues.

Types d'agrégation :

Paramètre

Description

Aucun

Aucune agrégation appliquée, les données sont traitées telles quelles.

Somme

Additionne toutes les valeurs de chaque période.

Moyenne

Calcule la moyenne de toutes les valeurs de chaque période.

Médiane

Renvoie la valeur médiane de toutes les valeurs de chaque période.

Nombre

Compte le nombre de valeurs non nulles pour chaque période.

Min

Renvoie la plus petite valeur de chaque période.

Max

Renvoie la valeur la plus grande au sein de chaque période.

Première

Renvoie la première valeur de chaque période.

Last

Renvoie la dernière valeur de chaque période.

STD

Calcule l'écart-type de toutes les valeurs de chaque période.

Autorisations

Lecture seule

  • Lire les résultats des prévisions

  • Rechercher des configurations de prévision par définition de valeur

Éditeur

  • Toutes les fonctionnalités du mode Lecture seule

  • Lister toutes les configurations de prévision (vue simple uniquement)

Éditeur de données

  • Tout ce que l'éditeur peut faire

  • Droits complets (créer, lire, mettre à jour, supprimer) sur les configurations de prévision et les groupes

  • Lancer, afficher et annuler des tâches de prévision

  • Exporter / importer des configurations

Admin

  • Tout ce que Dataeditor peut faire

  • Supprimer l'historique des tâches

Afficher les prévisions sur un tableau de bord

Utilisation du widget de prévision par défaut

SKOOR facilite l'accès aux prévisions en intégrant un bouton dans le widget de graphiques. Il suffit de créer un widget de graphique sur le tableau de bord, de définir le type de graphique sur « Mixte » et de configurer les mêmes définitions de données que dans la configuration des prévisions. Après avoir configuré la source de données, cliquez sur « Synchroniser les colonnes » dans la section « Colonnes » en bas à droite de la boîte de dialogue d'édition du widget, ou ajoutez manuellement la colonne pour laquelle des prévisions ont été établies. Cliquez ensuite sur cette colonne et cochez la case « Afficher les prévisions ». Sélectionnez la configuration de prévision correspondante dans le menu déroulant, puis appliquez. L'aperçu devrait désormais afficher les données historiques accompagnées de la prévision correspondante.

Screenshot 2026-04-10 at 08.22.41.png

Utilisation d'une requête de données personnalisée

Le tableau contenant les résultats de prévision peut être copié dans le presse-papiers en cliquant simplement sur le bouton « Copier le tableau » dans la page générale de la configuration de prévision. À l'aide de ce tableau, vous pouvez accéder aux données de prévision et rédiger votre propre requête de données, par exemple dans SKOOR Studio. Notez qu'il existe des différences dans les colonnes du tableau, comme décrit ci-dessous :

  • Prophet

    • Colonne de valeur (Portant le même nom que la colonne de valeur d'entrée.)

    • Colonne d'horodatage (nom identique à celui de la colonne d'horodatage d'entrée)

    • Valeur de confiance inférieure (Nommée de la même manière que la colonne de valeur d'entrée, mais avec « _lower » à la fin.)

    • Valeur de confiance supérieure (même nom que la colonne de valeur d'entrée, mais avec « _upper » à la fin)

    • Colonnes de précision

    • colonnes de discriminateur (nombre de colonnes égal au nombre de colonnes de discriminateur fourni. Nommées de la même manière que les colonnes de discriminateur d'entrée.)

  • Régression linéaire

    • colonne de valeur (Nommée de la même manière que la colonne de valeur d'entrée.)

    • Colonne d'horodatage (Nommée de la même manière que la colonne d'horodatage d'entrée.)

    • précision

    • colonnes discriminantes (Nombre de colonnes identique au nombre de colonnes discriminantes fourni. Noms identiques à ceux des colonnes discriminantes d'entrée.)

  • SARIMAX

    • Colonne de valeur (Nommée de la même manière que la colonne de valeur d'entrée.)

    • colonne d'horodatage (Nommée de la même manière que la colonne d'horodatage d'entrée.)

    • précision

    • colonnes discriminantes (Nombre de colonnes identique au nombre de colonnes discriminantes fourni. Noms identiques à ceux des colonnes discriminantes d'entrée.)

  • XGBoost

    • Colonne de valeur (Nommée de la même manière que la colonne de valeur d'entrée.)

    • colonne d'horodatage (Nommée de la même manière que la colonne d'horodatage d'entrée.)

    • précision

    • colonnes discriminantes (Nombre de colonnes identique au nombre de colonnes discriminantes fourni. Noms identiques à ceux des colonnes discriminantes d'entrée.)