Modifica del limite di allarme (lavoro)
Limiti di allarme statici
Dopo aver creato un lavoro, è necessario impostare soglie adeguate che rappresentino il suo stato attuale in base ai valori misurati. È possibile accedere direttamente alla sezione dei limiti di allarme selezionando Modifica -> Limiti di allarme dall'elenco a discesa di un lavoro oppure facendo clic su "OK, Modifica limiti di allarme" nella barra degli strumenti dopo aver configurato i dettagli del lavoro:
Alla creazione del lavoro, i limiti di allarme predefiniti vengono impostati in base al tipo di lavoro (vedere la sezione Plugin disponibili), ad esempio un nuovo lavoro Icmp ha i seguenti limiti di allarme configurati di default:
È possibile impostare limiti di allarme separati per ciascuno dei 3 stati Warning, Minor o Major.
Per aggiungere nuove soglie, fare clic sul pulsante +. Se per uno stato specifico è configurato più di un limite di allarme, impostare la loro correlazione selezionando uno dei pulsanti di opzione Qualsiasi o Tutti. Quando è selezionato Tutti, tutte le soglie devono essere soddisfatte per modificare lo stato del lavoro. Fare clic sul pulsante - per rimuovere una soglia.
Aggiunta di una soglia Minor aggiuntiva all'esempio sopra riportato:
In questo esempio, un allarme Minor viene attivato solo se il tempo di andata e ritorno del controllo icmp è stato superiore a 200 ms nelle ultime 3 esecuzioni del lavoro.
Esempi di stato di allarme del lavoro
I seguenti grafici della cronologia degli stati mostrano come cambia lo stato di un processo per diverse configurazioni dei limiti di allarme e dei relativi contatori. Vengono utilizzati i seguenti colori di stato:
Stessi limiti, contatori crescenti
Configurare il parametro per x volte per definire la frequenza con cui un valore deve superare il limite affinché un lavoro passi allo stato particolare non OK. Con il primo valore al di sotto del limite, il lavoro torna allo stato OK.
Limiti crescenti, contatori crescenti
Per i valori crescenti, lo stato cambia quando il valore supera n volte il limite specifico. Lo stesso accade per i valori decrescenti.
Limiti crescenti, contatori decrescenti
Per i valori crescenti e decrescenti, lo stato cambia quando il valore supera n volte il limite specifico. Se nessuna condizione è valida, il lavoro torna allo stato OK.
Manutenzione dipendente dal valore sui lavori parsefile
Se un file di input contiene informazioni sullo stato di manutenzione di un determinato dispositivo o oggetto, queste possono essere analizzate da un job parsefile sull'oggetto dispositivo e, a seconda dei risultati della sequenza di analisi, il job parsefile può essere messo in stato di manutenzione o meno. I job parsefile offrono la soglia di manutenzione aggiuntiva per consentire l'impostazione del job in manutenzione:
Un lavoro in stato di manutenzione propaga il suo stato di manutenzione verso l'alto al suo dispositivo. L'oggetto dispositivo stesso propaga quindi lo stato di manutenzione verso il basso a tutti i suoi lavori.
Limiti di allarme dipendenti dal tempo
Per impostazione predefinita, le soglie configurate sono sempre attive, il che significa che non è assegnata alcuna pianificazione specifica. Utilizzando una pianificazione, è possibile configurare soglie dipendenti dal tempo. Ciò è utile nel caso in cui si desideri stabilire diversi livelli di sensibilità per gli allarmi all'interno o all'esterno dell'orario di lavoro o durante le normali finestre di manutenzione. Configurando una pianificazione per i limiti di allarme di un lavoro, l'esecuzione del lavoro è ancora regolata dal suo intervallo di esecuzione, solo il suo stato e quindi la sua funzionalità di allarme sono dipendenti dal tempo.
Per impostare limiti di allarme dipendenti dal tempo, è possibile assegnare una pianificazione a ciascuna voce di limite di allarme. Innanzitutto, fare clic sul pulsante Sfoglia pianificazione per cercare l'oggetto di pianificazione. Tutti gli oggetti di pianificazione esistenti si trovano in /root/Configurations/Schedule. Selezionare una o più pianificazioni utilizzando le caselle di controllo, quindi fare clic su Avanti:
Ora le pianificazioni selezionate sono disponibili nell'elenco a discesa su ciascuno dei limiti di allarme:
Se un oggetto pianificazione di riferimento viene eliminato, il riferimento per la soglia cambia in Sempre attivo.
Se la definizione di una pianificazione viene modificata, il limite di allarme in un grafico storico viene visualizzato utilizzando la nuova definizione della pianificazione. Ciò vale anche se gli stati corrispondenti sono stati calcolati utilizzando la definizione valida prima che la modifica fosse eseguita. I grafici storici non riflettono la cronologia degli oggetti di configurazione.
Limiti di allarme variabili con fonte di timestamp esterna
I limiti di allarme statici funzionano bene per i sistemi che non prevedono l'interazione umana. In situazioni in cui un timestamp in un file viene aggiornato solo se un essere umano interviene, il timestamp non verrà modificato nei giorni festivi o nei fine settimana. Un file aggiornato regolarmente durante l'orario di lavoro potrebbe non essere più vecchio di 24 ore, ma potrebbe facilmente essere più vecchio di 60 ore durante il fine settimana, per non parlare di cosa succede se un giorno festivo è adiacente a un fine settimana. Per gestire tali situazioni è possibile utilizzare un controllo variabile del timestamp.
Alcuni tipi di plugin (ad esempio i plugin Execute o Parsefile) supportano la lettura del timestamp da una fonte esterna.
Il timestamp può essere fornito come numero assoluto di secondi dal 1.1.970 (tempo UNIX epoch) o come età variabile in secondi. Se si utilizza il primo metodo, il nome dell'unità può essere definito con la parola magica timestamp e il numero piuttosto illeggibile verrà automaticamente trasformato in una stringa leggibile:
La configurazione corrispondente per un limite di allarme variabile è la seguente:
Invece di un limite statico di ad esempio 1h, viene inserita una stringa speciale come =1h+132. Il segno "=" indica un limite di allarme variabile. La stringa seguente esprime l'età desiderata e +132 indica l'ID della pianificazione da aggiungere. Vedere il capitolo Pianificazione e pianificazione delle eccezioni per informazioni su come creare una pianificazione.
Limiti di allarme adattivi
I limiti di allarme possono anche essere impostati in base alla deviazione standard (σ) o a una deviazione percentuale. I valori misurati da un processo possono essere presi in considerazione per l'allarme. Ciò può essere utile nei casi in cui il valore di un processo segue un andamento settimanale più o meno regolare. Ad esempio, l'utilizzo del disco e della CPU su un dispositivo che esegue processi di backup locali ogni domenica aumenta durante i backup e torna a livelli normali al termine dei backup. Si vorrebbe riconoscere quei casi in cui i valori di utilizzo del disco o della CPU si discostano da questo comportamento normale, ad esempio quando l'utilizzo del disco aumenta in modo significativo quando non sono attive finestre di backup. Un altro esempio di utilizzo dei limiti di allarme adattivi potrebbe essere un sistema di transazioni online che di solito ha un carico elevato durante il giorno e un carico molto basso durante la notte o nel fine settimana. I limiti di allarme adattivi possono aiutare a rilevare anomalie in questo comportamento.
Nei casi in cui si riscontra una tendenza più o meno lineare nella cronologia dei valori, ad esempio quando l'utilizzo del disco aumenta continuamente sul volume del disco di un file server, potrebbe essere utile ricevere una notifica con un certo numero di giorni o settimane di anticipo, prima che il livello di utilizzo del disco raggiunga un determinato valore. In questo modo è possibile acquistare dischi aggiuntivi per aumentare il volume di archiviazione.
Gli operatori σ e %, così come gli elementi Anticipated, possono essere utilizzati per gli scopi sopra indicati:
Non combinare gli operatori di limite di allarme σ o % con la funzione Anticipated (sulla stessa riga del limite di allarme). Utilizzarli su dati che hanno un basso coefficiente di correlazione ma mostrano tendenze settimanali regolari.
Questi limiti di allarme adattivi possono anche essere combinati con limiti di allarme statici.
Si prega di notare che SKOOR Engine avrà bisogno di un po' di tempo per calcolare i dati di previsione. Durante questo periodo, mostrerà il seguente messaggio nella sezione dell'intestazione dell'interfaccia utente fintanto che la scheda Adattivo è selezionata:
Limiti di allarme con valori anticipati
Passare alla scheda Adattivo per visualizzare i valori storici, la serie temporale media calcolata e i limiti di allarme corrispondenti proiettati nel futuro. L'esempio seguente mostra la scheda Adattivo con gli ultimi 14 giorni di una cronologia dei valori (linea blu) con un andamento quasi perfettamente lineare:
Il coefficiente di correlazione calcolato dai dati è mostrato nella parte superiore del grafico. Il trend dei dati effettivamente misurati è proiettato nel futuro per le prossime 25 settimane. Ciò corrisponde alla linea di tendenza grigia. L'intervallo di tempo nel futuro può essere scelto dal secondo elenco a discesa.
Per l'esempio sopra riportato sono stati impostati i seguenti limiti di allarme:
Si può notare che una settimana prima che venga raggiunto il valore 240 (come previsto dall'andamento attuale), il lavoro assumerà lo stato di Warning. Lo stesso vale per gli stati Minor e Major.
Deviazione standard (σ) e deviazione percentuale
Per i valori misurati che non seguono un trend lineare così chiaro, ovvero che mostrano un coefficiente di correlazione inferiore, è possibile impostare i limiti di allarme σ o %:
Questo esempio mostra un andamento settimanale con valori significativamente inferiori nei fine settimana. In questi casi non è possibile effettuare una previsione perché i valori misurati sono distribuiti su un ampio intervallo, ma la scheda Adaptive visualizza questa dispersione e la combina con i limiti di allarme attualmente configurati:
Il grafico nella scheda Adattivo può apparire in due modi diversi a seconda della correlazione calcolata. Se il coefficiente di correlazione r è superiore a 0,3, viene utilizzato il calcolo dipendente dall'ora/giorno e verrà visualizzato un grafico incentrato sulla tendenza come nella sezione Limiti di allarme con valori anticipati. Vengono quindi calcolati coefficienti di correlazione separati per i dati orari e giornalieri. Se è inferiore, il grafico mostra una vista dei limiti di allarme calcolati solo sulla base dei dati storici (senza previsioni per il futuro), come mostrato sopra.
Se il valore casuale fosse anormalmente alto nel fine settimana successivo, ad esempio alto come nei normali giorni feriali, ciò attiverebbe il limite di allarme +2,5 σ e/o +200% e lo stato del lavoro diventerebbe Minor o addirittura Major.
Il lavoro genera un allarme non appena i valori misurati esulano dai valori previsti calcolati dai dati storici. In pratica, ciò significa che per il calcolo delle statistiche vengono prese in considerazione le ultime 5 settimane di dati, con una ponderazione ridotta per le settimane più lontane nel tempo.
I limiti di allarme possono essere visualizzati anche dalla cronologia dei valori del lavoro. Per ulteriori dettagli, consultare la sezione Mostra cronologia valori.
Le singole curve nel grafico sopra possono essere nascoste facendo clic sul pulsante rotondo con il colore corrispondente. Ad esempio, facendo clic sul pulsante nero Trend si nasconde la linea di tendenza.
Selezione dell'intervallo di tempo
Sotto il grafico nella scheda Adattivo è presente una linea temporale dell'intero intervallo di tempo configurato nell'elenco a discesa nella parte superiore del grafico (1 settimana in questo esempio). Qui è possibile specificare l'intervallo di tempo da visualizzare nel grafico principale selezionando un intervallo di tempo con il mouse:
L'intervallo di tempo sotto il cursore viene mostrato come una sezione ingrandita in alto. Può essere regolato su ciascuna estremità o spostato a sinistra o a destra.
Offset per i limiti di allarme percentuali
A volte il limite di allarme percentuale viene attivato anche se i valori attuali mostrano un andamento molto simile a quello delle settimane precedenti. Questo accade spesso nei periodi in cui la ripidità della curva dei valori è molto elevata. In questi casi, i limiti di allarme percentuali possono essere migliorati con un offset statico numerico. L'esempio seguente mostra una curva di valori (blu) in cui i limiti di allarme sono stati configurati per lo stato Minor e Major, entrambi con una soglia del -40%, ma il limite di allarme Major è stato configurato con un offset aggiuntivo di 1000. L'offset viene configurato aggiungendolo al valore percentuale con un carattere +.
L'offset spinge la curva della soglia Major rossa di 1000 unità (in questo caso: chiamate) verso il basso, in modo che la soglia Major non venga raggiunta facilmente durante l'inizio ripido del valore in aumento.
Limite per i limiti di allarme percentuali
A volte si desidera utilizzare soglie percentuali, ma si vuole assicurarsi che ci sia ancora un limite massimo rigido a un certo valore. L'esempio seguente mostra una curva di valori (blu) in cui i limiti di allarme sono stati configurati per lo stato Minor. Un limite percentuale positivo e uno negativo con un limite rigido rispettivamente di 1000 e 3000 unità. Tali limiti sono configurati aggiungendo il limite statico al valore percentuale con un carattere >.
Ciò significa che il limite negativo del 40% è impostato su 0 se il limite calcolato è inferiore a 1000 e il limite positivo del 60% è impostato su un minimo di 3000 se il limite calcolato è inferiore a 3000.
Programma per i limiti di allarme adattivi
Poiché i limiti di allarme adattivi cercano di adattarsi ai carichi giornalieri, potrebbe essere necessario tenere conto di anomalie note come i giorni festivi. Se un sistema ha un carico elevato ogni venerdì, ma il Venerdì Santo siipotizza un carico molto basso o addirittura nullo, è necessario trovare un modo per insegnare al sistema che il Venerdì Santo non è un venerdì normale, ma si comporterà come una domenica. Per ottenere questo risultato, è possibile configurare un tipo speciale di programma. Per ulteriori informazioni, consultare la sezione Programma per la previsione.
Creare una pianificazione per la previsione:
Nell'esempio seguente, il Venerdì Santo e il Lunedì di Pasqua verranno applicati i limiti di allarme adattivi calcolati in base ai carichi dell'ultima domenica:
Ora collegare questo programma ai lavori con limiti di allarme adattivi sfogliando e selezionando il programma utilizzando il menu a tendina Programma di previsione:
È anche possibile configurare modifiche una tantum ai limiti di allarme, selezionando Una tantum invece di Annuale (festività) dall'elenco a discesa Tipo di ripetizione:
Questi parametri di pianificazione possono anche essere combinati con normali pianificazioni attive all'interno dello stesso oggetto di pianificazione. La figura seguente mostra un esempio di pianificazione attiva che definisce l'orario di lavoro per gli allarmi e specifica anche che il Venerdì Santo e il Lunedì di Pasqua devono essere trattati come domeniche per il calcolo dei limiti di allarme adattivi:
Correzione dei valori di lavoro con misurazioni errate o mancanti
A volte i valori di un lavoro sono stati compromessi da una configurazione errata dei parametri del lavoro (ad esempio, è stato selezionato un valore errato che ha portato a valori estremamente alti o bassi) o perché il lavoro non era attivo e non effettuava misurazioni quando avrebbe dovuto. Nell'esempio seguente, un lavoro non effettuava più misurazioni corrette dal 6 ottobre circa. I valori errati influiscono negativamente sul calcolo delle statistiche:
In tal caso, i dati possono essere invalidati. Nell'esempio sopra riportato, l'intervallo di tempo compreso tra il 6 e il 14 ottobre sarà invalidato e non sarà più preso in considerazione per il calcolo del limite di allarme adattivo.
L'intervallo di tempo richiesto può essere specificato nel selettore di tempo sotto il grafico:
Sotto il selettore saranno visibili due pulsanti, uno per invalidare e uno per convalidare i dati nell'intervallo di tempo selezionato:
Dopo aver cliccato e confermato Invalidate (Invalida) o Validate (Convalida), il selettore di tempo mostra i rispettivi intervalli di tempo con dei segni rossi:
Inoltre, diventa visibile il pulsante Ricalcola dati di previsione. È necessario fare clic su questo pulsante per calcolare i dati di previsione con i valori modificati:
Obiettivi
Un tipo speciale di limite di allarme disponibile nel SKOOR Engine è chiamato Obiettivo. Il suo scopo è quello di visualizzare una linea obiettivo nella cronologia dei valori di un dashboard. Per impostare un valore obiettivo, cliccare sulla scheda Obiettivi nella finestra di modifica dei limiti di allarme:
Fare clic sul pulsante + e scegliere uno dei valori disponibili dal menu a discesa. Successivamente, è possibile impostare il valore desiderato nel campo corrispondente, 5000 nell'esempio sopra riportato. Il seguente widget della cronologia dei valori mostra l'obiettivo configurato come linea tratteggiata, a partire dal momento in cui è stato configurato. Gli obiettivi, come i limiti di allarme, dipendono dal tempo. In questo modo, le cronologie dei valori possono sempre essere visualizzate con i limiti di allarme e gli obiettivi che avevano in un determinato momento.








































