Intégration dans SKOOR

Alarme

L'installation de SKOOR ajoutera automatiquement la ligne suivante à la crontab de l'utilisateur eranger sur les hôtes primaire et de secours:

*/5 * * * * sudo /opt/eranger/bin/eranger-server-replication.pl status /var/opt/run/eranger/collector/tmp/replication.status > /dev/null 2>&1

Si la réplication est synchronisée, le fichier de sortie replication.status ressemblera à ceci :

# Mon Jan 15 19:15:04 2018
# Status is OK, if there is at least one slave, FAILED otherwise
# Legend: 'Slave: <seconds-last-read> (<ip>)'
# slaves: 1
Status: OK
Slave: 2 (10.1.0.89)

La valeur numérique sur la dernière ligne (2 ici) est le temps écoulé (en secondes) depuis la dernière fois que le primaire a transféré des données au standby.

Si la réplication n'est pas synchronisée ou ne fonctionne pas, le fichier aura le contenu suivant :

# Mon Jan 15 19:20:08 2018
# Status is OK, if there is at least one slave, FAILED otherwise
# Legend: 'Slave: <seconds-last-read> (<ip>)'
# slaves: 1
Status: FAILED
Slave:  (0)

La réplication peut être surveillée à l'aide de la tâche parsefile préconfigurée dans SKOOR sous le dispositif SKOOR Engine localhost:

Pour activer la tâche, définissez son paramètre Intervalle sur par exemple 10 minutes.

Notification d'indisponibilité du serveur primaire

En supposant qu'un AlarmGroup soit lié sous le dispositif SKOOR Engine localhost, tant que l'Engine SKOOR est toujours en cours d'exécution, il générera des messages d'alarme dès que la réplication aura échoué.

Si, pour une raison quelconque, le SKOOR Engine lui-même ne fonctionne plus, le système ne peut pas envoyer d'alarme. Pour cette raison, une adresse e-mail dédiée doit être définie dans le fichier eranger-replication.cfg :

...
email=support@skoor.com
# email_status=/var/opt/run/eranger/collector/tmp/replication.status
# server_ping=/opt/eranger/bin/eranger-server-ping.pl
...

Puisque la tâche cronjob ci-dessus est également exécutée par cron toutes les 5 minutes sur le standby, elle vérifiera le primaire en utilisant eranger-server-ping.pl. Une fois qu'il détecte que les démons SKOOR ne tournent plus sur le primaire, il enverra exactement un email au destinataire défini dans le fichier de configuration ci-dessus. En d'autres termes :

Le serveur en attente effectue une surveillance de base du serveur primaire.

Ce simple email de notification aura pour objet

  • Sujet : eranger-server-replication.pl

  • Corps : 10.1.0.88 is down

Si plusieurs adresses électroniques doivent être notifiées, séparez-les par une virgule. Exemple :

email=support@skoor.com,youraccount@domain.com