Prognosen
Prognosen
Übersicht
Identifizierte Sprachinkongruenz und vorbereitete englische Überarbeitung
Das Prognosemodul von SKOOR bietet ML-basierte Vorhersagen zukünftiger Trends anhand von Zeitreihendaten. Es stehen vier Modelle zur Verfügung:
Lineare Regression (siehe offizielle Dokumentation hier)
Alle Modelle unterstützen zeitindexierte Reihen, die direkt aus einer SKOOR-Datenquelle oder einem DataQuery stammen.
Prognoseseite
Die Prognoseseite ist in zwei Abschnitte unterteilt.
Allgemeine Seite
Dieser Abschnitt enthält die Einstellungen für die Prognosen.
Auf der linken Seite:
Einstellung | Beschreibung |
|---|---|
Zeitraum | Der gewünschte Zeitraum der Prognose. |
Planung aktivieren | Planung der Prognosen zur Automatisierung der Prognosen. |
Prognosemodell konfigurieren | Wählen Sie das Modell für die Prognose aus. |
Datendefinition konfigurieren | Wählen Sie die Daten für die Prognose aus. |
Tabellenauswahl kopieren | Schaltfläche zum Kopieren der Tabelle, die die Prognose enthält. |
Prognose ausführen | Führt eine Prognose mit den konfigurierten Einstellungen aus. Status und Fortschritt sind auf der Ausführungsseite einsehbar. |
Speichern | Speichert die Prognosekonfiguration. Wenn die Option „Hyperparameter-Suche“ im Modellkonfigurator aktiviert ist, wird beim Speichern automatisch ein Prognose-Lauf ausgelöst. |
Auf der rechten Seite befindet sich die Übersicht über die Prognosedaten in einer Tabelle. Sie wird nur angezeigt, wenn bereits eine Prognose vorliegt.
Ausführungsseite
Dieser Bereich ist für die Ausführung und Überwachung der Prognoseläufe zuständig. Er bietet Zugriff auf den Verlauf und ermöglicht Einblicke.
Eine Prognose kann durch Klicken auf die Schaltfläche „Prognose ausführen“ gestartet werden. Der gesamte Verlauf der Läufe kann durch Klicken auf die Schaltfläche „Auftragsverlauf löschen“ gelöscht werden. Beachten Sie, dass alle durch die Prognosen erstellten Tabellen gelöscht werden und Sie die Prognose erneut ausführen müssen, um sie wieder zu erhalten. Wenn ein Auftrag noch läuft, kann er durch Klicken auf das rote X rechts neben dem angezeigten Status abgebrochen werden.
Wenn Sie auf einen Job klicken, werden die Konsolenausgabe, der Fortschritt, der Status und weitere Informationen angezeigt. In der Konsolenausgabe werden alle Gruppen und deren Genauigkeit ausgegeben. Die angezeigte Genauigkeit wird anhand des WAPE (Weighted Absolute Percentage Error) gemessen, in Prozent angegeben und auf der Grundlage der Modellleistung bei historischen Daten berechnet.
Erstellen einer Vorhersage
Eine Prognosekonfiguration kann entweder durch Klicken auf die Plus-Schaltfläche auf der linken Seite und Eingabe eines Namens oder durch Importieren einer Prognose im JSON-Format erstellt werden. Nach dem Erstellen einer Prognosekonfiguration müssen auf der Seite „Allgemein“ einige Einstellungen vorgenommen werden.
Modellkonfiguration
Durch Klicken auf die Schaltfläche „Prognosemodell konfigurieren“ öffnet sich ein Dialogfeld, in dem das Modell ausgewählt werden kann. Derzeit stehen 4 verschiedene Modelloptionen zur Verfügung, die unten aufgeführt sind. Einige der Modelle verfügen über eine Schaltfläche zur Hyperparameter-Optimierung, mit der das Modell verschiedene Kombinationen von Hyperparametern testen kann, um die beste zu finden. Verschiedene Hyperparameter, die eingestellt werden können, sind unterhalb des Modells aufgelistet. Wenn die Hyperparameter-Suche bereits ausgelöst wurde, können Sie die Hyperparameter anzeigen und kopieren, indem Sie auf die Schaltfläche „Optimierte Hyperparameter anzeigen“ klicken.
Wenn Sie die Einstellung der Hyperparameter abgeschlossen haben, klicken Sie auf „Speichern“, um die Modellkonfiguration zu speichern, oder auf „Abbrechen“, um die Änderungen rückgängig zu machen.
Folgende Modelle stehen zur Auswahl:
Prophet
Prophet ist ein auf maschinellem Lernen basierendes Open-Source-Tool, das von Meta (ehemals Facebook) für die Prognose von Zeitreihendaten entwickelt wurde. Es ist so konzipiert, dass es robust gegenüber fehlenden Daten und Trendverschiebungen ist, und eignet sich besonders gut für die Prognose von Zeitreihen mit starker Saisonalität. Prophet kann Feiertagseffekte automatisch berücksichtigen und ermöglicht es dem Benutzer, eigene Hyperparameter festzulegen, um die Genauigkeit noch weiter zu steigern.
Prophet ist die am häufigsten verwendete der verfügbaren Optionen, da das Training nur mäßig viel Zeit in Anspruch nimmt, das Tool jedoch durchweg die besten Ergebnisse liefert, was es in den meisten Szenarien zur kostengünstigsten Wahl macht. Prophet zeichnet sich besonders aus, wenn Daten aus mehreren Saisonen vorliegen, in denen wiederkehrende saisonale Effekte, Feiertagseffekte oder unregelmäßige Trendverschiebungen auftreten.
Bei Auswahl zeigt das Prophet-Modell auch Konfidenzintervalle an, die die Sicherheit des Modells bei seinen Vorhersagen angeben. Bei der Visualisierung auf dem Dashboard wird das Konfidenzintervall in einer helleren Farbe um die Prognose herum dargestellt.
Die folgenden Variablen können konfiguriert werden:
Einstellung | Beschreibung |
|---|---|
seasonality_mode | Legt fest, ob saisonale Effekte zum Trend addiert oder mit diesem multipliziert werden. Standard: „ |
yearly_seasonality | Aktiviert, deaktiviert oder erkennt automatisch die Anpassung eines jährlichen saisonalen Musters. Standard: |
weekly_seasonality | Aktiviert, deaktiviert oder erkennt automatisch die Anpassung eines wöchentlichen saisonalen Musters. Standard: |
daily_seasonality | Aktiviert, deaktiviert oder erkennt automatisch die Anpassung eines täglichen saisonalen Musters. Standard: |
interval_width | Breite des Unsicherheitsintervalls, das mit jeder Prognose zurückgegeben wird. Standard: |
mcmc_samples | Anzahl der MCMC-Stichproben für die vollständige Bayes'sche Inferenz; bei 0 wird stattdessen die MAP-Schätzung verwendet. Standard: |
changepoint_prior_scale | Steuert die Trendflexibilität an Wendepunkten; höhere Werte ermöglichen aggressivere Trendwechsel. Standard: |
seasonality_prior_scale | Regularisierungsstärke für saisonale Komponenten; höhere Werte ermöglichen größere saisonale Schwankungen. Standard: |
holidays_prior_scale | Steuert das Ausmaß der Feiertagseffekte auf die Prognose. Standard: |
changepoint_range | Anteil der Trainingshistorie, in dem Trendwechselpunkte auftreten dürfen. Standard: |
n_changepoints | Anzahl potenzieller Trendwechselpunkte, die automatisch in den Trainingszeitraum eingefügt werden. Standard: |
uncertainty_samples | Anzahl der posterioren Ziehungen, die zur Schätzung der Prognoseunsicherheitsintervalle verwendet werden. Standard: |
SARIMAX
SARIMAX (Seasonal Autoregressive Integrated Moving Average with Exogenous Regressors) ist ein statistisches Modell, das verwendet wird, um zukünftige Werte auf der Grundlage vergangener Daten vorherzusagen. Es berücksichtigt sowohl Trends als auch saisonale Muster. Es ist die Erweiterung des ARIMA-Modells durch Hinzufügen saisonaler Komponenten.
SARIMAX eignet sich besonders, wenn die Daten stabil und konsistent generiert werden und ein statistisches Modell einem Modell des maschinellen Lernens vorzuziehen ist.
Im SARIMAX-Modell gibt es keine Variablen, die vom Benutzer angepasst werden können.
Lineare Regression
Die lineare Regression wird verwendet, um Trends zu prognostizieren, indem eine Gerade an die Trainingsdaten angepasst und diese Linie in die Zukunft fortgeführt wird. Sie ist ein leistungsstarkes Werkzeug zur Vorhersage zukünftiger Trends in beliebigen Zeitreihendaten.
Die lineare Regression eignet sich am besten, wenn die zugrunde liegenden Daten einen klaren, konsistenten linearen Trend mit minimaler Saisonalität oder minimalem Rauschen aufweisen.
Im linearen Regressionsmodell gibt es keine Variablen, die vom Benutzer angepasst werden können.
XGBoost
Das XGBoost-Modell verwendet gradient-boosted Entscheidungsbäume für direkte mehrstufige Prognosen. Vor dem Training wendet es umfangreiches Feature Engineering auf die Eingabezeitreihen an, extrahiert Verzögerungsmerkmale, rollierende Statistiken und kalenderbasierte Merkmale und prognostiziert dann jeden zukünftigen Punkt unabhängig.
XGBoost eignet sich am besten für komplexe, nichtlineare Daten. Es kann eine gute Genauigkeit erreichen, benötigt jedoch Zeit für das Training, und in einigen Fällen müssen die Daten zuvor separat vorverarbeitet werden.
Die folgenden Variablen können konfiguriert werden:
Einstellung | Beschreibung |
|---|---|
Ziel | Während des Trainings verwendete Verlustfunktion; bestimmt, welche Fehlermetrik das Modell optimiert. Standard: |
quantile_alpha | Zielquantilniveau bei Verwendung der Quantilregression als Zielfunktion. Standard: |
n_estimators | Anzahl der zu erstellenden Boosting-Bäume; mehr Bäume erhöhen die Kapazität, bergen jedoch das Risiko einer Überanpassung. Standard: |
learning_rate | Schrittweite der Schrumpfung, die nach jedem Baum angewendet wird, um Überanpassung zu verhindern. Standard: |
max_depth | Maximale Tiefe jedes Baums; steuert die Modellkomplexität und die Interaktionsordnung. Standard: |
min_child_weight | Minimale Summe der Instanzgewichte, die zum Erstellen eines Blattknotens erforderlich ist. Standard: |
gamma | Minimale Verlustreduktion, die erforderlich ist, um einen Knoten zu teilen; höhere Werte machen das Modell konservativer. Standard: |
subsample | Anteil der pro Baum ausgewählten Trainingszeilen, der zur Verringerung des Überanpassens verwendet wird. Standard: |
colsample_bytree | Anteil der Merkmale, die beim Aufbau jedes Baums zufällig ausgewählt werden. Standard: |
reg_alpha | L1-Regularisierungsterm für Blattgewichte; fördert spärliche Lösungen. Standard: |
reg_lambda | L2-Regularisierungsterm für Blattgewichte; bestraft große Gewichtswerte. Standard: |
Datenquelle
Im Fenster „Datenquelle konfigurieren“ können Sie die Daten angeben, die zum Trainieren des Modells verwendet werden sollen.
Die Datenquelle kann auf der linken Seite ausgewählt werden. Es gibt zwei Arten von Datenquellen: eine Datenquelle aus Ihrer SKOOR-Datenbank oder eine Datenabfrage über die Registerkarte „Data Query“. Bei der Auswahl der Datenquelle sind weitere Angaben erforderlich, die im Fenster festgelegt werden können, wie z. B. die Datenquelle, die Tabelle und die Spalten. Bei Auswahl der Option „Data Query“ müssen die Datenabfrage sowie die Spalten dieser Datenabfrage festgelegt werden.
Wert-, Datumsstempel- und Diskriminatorspalten können durch Klicken auf das Dropdown-Menü ausgewählt werden. Das Dropdown-Menü zeigt automatisch Spalten an, die die Anforderungen erfüllen. Folgende Spalten müssen ausgewählt werden:
Einstellung | Beschreibung |
|---|---|
Wertespalte | Muss numerische Werte enthalten, die jedem Zeitstempel zugeordnet sind. |
Datumsstempel-Spalte | Die Daten müssen das Zeitstempelformat JJJJ-MM-TT HH:mm verwenden, und jede Datengruppe muss über eindeutige Zeitstempel pro Gruppe verfügen (Gruppen definiert durch Diskriminatorspalten oder die inhärente Datenstruktur). |
Diskriminatorspalten | Optionale Spalten zur Definition von Gruppierungen und Hierarchien (z. B. Land → Bundesland → Stadt). Es gibt keine strengen Datenanforderungen, aber die Reihenfolge der Spalten ist wichtig, da jede Ebene die Gruppierung weiter verfeinert. |
Auf der rechten Seite des Datenfensters können weitere Datenvorbereitungsschritte ausgewählt werden.
Einstellung | Beschreibung |
|---|---|
Frequenz | Legt die Ausgabeauflösung der Prognose fest. Weitere Informationen. |
Interpolationstyp | Legt fest, wie fehlende Zeitstempel ergänzt werden. Weitere Informationen. |
Aggregationstyp | Steuert, wie mehrere Werte innerhalb eines Zeitraums kombiniert werden. Weitere Informationen. |
Frequenz
Die Häufigkeit bestimmt die Ausgabe der Prognose. Folgende Häufigkeiten stehen zur Auswahl:
Einstellung | Beschreibung |
|---|---|
SEKUNDENWEISE | Prognoseausgabe mit einer Auflösung von einer Sekunde. |
MINUTELY | Prognoseausgabe mit einer Auflösung von einer Minute. |
STÜNDLICH | Prognoseausgabe mit stündlicher Auflösung. |
TÄGLICH | Prognoseausgabe mit täglicher Auflösung. |
WÖCHENTLICH_SONNTAG | Prognoseausgabe mit wöchentlicher Auflösung, die Woche beginnt am Sonntag. |
WÖCHENTLICH_MON | Prognoseausgabe mit wöchentlicher Auflösung, die Woche beginnt am Montag. |
WEEKLY_TUE | Prognoseausgabe mit wöchentlicher Auflösung, die Woche beginnt am Dienstag. |
WEEKLY_WED | Prognoseausgabe mit wöchentlicher Auflösung, die Woche beginnt am Mittwoch. |
WEEKLY_THU | Prognoseausgabe mit wöchentlicher Auflösung, die Woche beginnt am Donnerstag. |
WEEKLY_FRI | Prognoseausgabe mit wöchentlicher Auflösung, die Woche beginnt am Freitag. |
WEEKLY_SAT | Prognoseausgabe mit wöchentlicher Auflösung, die Woche beginnt am Samstag. |
MONTHLY_END | Prognoseausgabe mit monatlicher Auflösung, bezogen auf den letzten Tag des Monats. |
MONTHLY_START | Prognoseausgabe mit monatlicher Auflösung, bezogen auf den ersten Tag des Monats. |
QUARTERLY_END | Prognoseausgabe mit vierteljährlicher Auflösung, bezogen auf den letzten Tag des Quartals. |
QUARTERLY_START | Prognoseausgabe mit vierteljährlicher Auflösung, bezogen auf den ersten Tag des Quartals. |
YEARLY_END | Prognoseausgabe mit jährlicher Auflösung, bezogen auf den letzten Tag des Jahres. |
YEARLY_START | Prognoseausgabe mit jährlicher Auflösung, bezogen auf den ersten Tag des Jahres. |
Intern wird die bereitgestellte Datenreihe mithilfe des Interpolationstyps und/oder des Aggregationstyps auf die festgelegte Frequenz interpoliert oder aggregiert. Beachten Sie, dass, wenn Ihre Daten fehlende Datumsstempel enthalten oder zu viele für die Frequenz aufweisen, die ausgewählte Interpolation und/oder Aggregation automatisch angewendet wird, um eine reibungslose Prognose zu gewährleisten.
Interpolationstypen:
Einstellung | Beschreibung |
|---|---|
Keine | Es wird keine Interpolation angewendet, die Daten werden unverändert verarbeitet. |
Linear | Füllt Lücken, indem eine gerade Linie zwischen bekannten Werten gezogen wird. |
Erste | Füllt Lücken vorwärts unter Verwendung des letzten bekannten Werts (Vorwärtsfüllung). |
Letzter | Füllt Lücken rückwärts unter Verwendung des nächsten bekannten Werts (rückwärts füllen). |
Spline | Füllt Lücken mit einer glatten kubischen Kurve, die an die bekannten Werte angepasst wird. |
Aggregationstypen:
Einstellung | Beschreibung |
|---|---|
Keine | Es wird keine Aggregation angewendet, die Daten werden unverändert verarbeitet. |
Summe | Addiert alle Werte innerhalb jedes Zeitraums. |
Durchschnitt | Berechnet den Mittelwert aller Werte innerhalb jedes Zeitraums. |
Median | Gibt den Mittelwert aller Werte innerhalb jedes Zeitraums zurück. |
Anzahl | Zählt die Anzahl der Nicht-Null-Werte innerhalb jedes Zeitraums. |
Min | Gibt den kleinsten Wert innerhalb jedes Zeitraums zurück. |
Max | Gibt den größten Wert innerhalb jedes Zeitraums zurück. |
Erster | Gibt den ersten Wert innerhalb jedes Zeitraums zurück. |
Last | Gibt den letzten Wert innerhalb jedes Zeitraums zurück. |
STD | Berechnet die Standardabweichung aller Werte innerhalb jedes Zeitraums. |
Berechtigungen
Nur-Lesezugriff
Prognoseergebnisse lesen
Prognosekonfigurationen nach Wertdefinition suchen
Editor
Alles, was „Nur lesen“ kann
Alle Prognosekonfigurationen auflisten (nur einfache Ansicht)
Dateneditor
Alles, was der Editor kann
Volle Rechte (Erstellen, Lesen, Aktualisieren, Löschen) für Prognosekonfigurationen und Gruppen
Prognoseaufträge starten, anzeigen und abbrechen
Konfigurationen exportieren/importieren
Admin
Alles, was der Dataeditor kann
Auftragsverlauf löschen
Anzeigen der Prognose auf einem Dashboard
Verwendung des Standard-Prognose-Widgets
SKOOR ermöglicht einen einfachen Zugriff auf die Prognose durch die Einführung einer Schaltfläche im Diagramm-Widget. Erstellen Sie einfach ein Diagramm-Widget auf dem Dashboard, stellen Sie den Diagrammtyp auf „Gemischt“ ein und konfigurieren Sie dieselben Datendefinitionen wie in der Prognosekonfiguration. Nachdem Sie die Datenquelle eingerichtet haben, klicken Sie entweder im Widget-Bearbeitungsdialog unten rechts im Abschnitt „Spalten“ auf „Spalten synchronisieren“ oder fügen Sie die Spalten, für die eine Prognose erstellt wurde, manuell hinzu. Klicken Sie dann auf diese Spalten und aktivieren Sie das Kontrollkästchen „Prognose anzeigen“. Wählen Sie die passende Prognosekonfiguration aus der Dropdown-Liste aus und klicken Sie auf „Übernehmen“. Nun sollte die Vorschau bereits die historischen Daten mit der entsprechenden Prognose anzeigen.
Verwendung einer benutzerdefinierten Datenabfrage
Die Tabelle mit den Prognoseergebnissen kann durch einfaches Klicken auf die Schaltfläche „Tabelle kopieren“ auf der Seite „Allgemein“ der Prognosekonfiguration in die Zwischenablage kopiert werden. Mit dieser Tabelle können Sie auf die Prognosedaten zugreifen und Ihre eigene Datenabfrage erstellen, z. B. in SKOOR Studio. Beachten Sie, dass es Unterschiede in den Tabellenspalten gibt, wie beschrieben:
Prophet
Wertespalte (Trägt denselben Namen wie die Eingabewertespalte.)
Datumsstempel-Spalte (Trägt denselben Namen wie die Eingabe-Datumsstempel-Spalte.)
Spalte „Unterer Konfidenzwert“ (Trägt denselben Namen wie die Eingabewertspalte, endet jedoch mit „_lower“.)
Obere Konfidenz (Trägt denselben Namen wie die Eingabewert-Spalte, jedoch mit „_upper“ am Ende.)
Genauigkeit
Diskriminatorspalten (Anzahl der Spalten entspricht der Anzahl der angegebenen Diskriminatorspalten. Benannt wie die Eingabespalten für die Diskriminatoren.)
Lineare Regression
Wertespalte (Trägt denselben Namen wie die Eingabewertspalte.)
Datumsstempel-Spalte (Namenidentisch mit der Eingabe-Datumsstempel-Spalte.)
Genauigkeit
Diskriminatorspalten (Anzahl der Spalten entspricht der Anzahl der angegebenen Diskriminatorspalten. Namen entsprechen denen der Eingabediskriminatorspalten.)
SARIMAX
Wertespalte (Trägt denselben Namen wie die Eingabewertespalte.)
Datumsstempel-Spalte (Namenidentisch mit der Eingabe-Datumsstempel-Spalte.)
Genauigkeit
Diskriminatorspalten (Anzahl der Spalten entspricht der Anzahl der angegebenen Diskriminatorspalten. Namen entsprechen denen der Eingabe-Diskriminatorspalten.)
XGBoost
Wertspalte (Trägt denselben Namen wie die Eingabewertspalte.)
Datumsstempel-Spalte (Trägt denselben Namen wie die Eingabe-Datumsstempel-Spalte.)
Genauigkeit
Diskriminatorspalten (Anzahl der Spalten entspricht der Anzahl der angegebenen Diskriminatorspalten. Namen entsprechen denen der Eingabe-Diskriminatorspalten.)





