Anomalie #978
closedremonté des alertes lorsqu'un service ou une machine est planté
100%
Description
Ce qui est arrivé:
- Fred est arrivé un matin au local
- En se connectant il s'aperçoit que la machine pavot est planté
- En utilisant DRAC et gnash il parvient a rebooter en appuyant sur F1
Ce qui aurait du arriver:
- Pavot est planté
- Une alerte zabbix note le plantage
- Un mail est envoyé à une ou plusieurs personnes de l'équipe d'adminsys sur leurs adresses personelles de façon a maximiser les chances de les joindre
- Une personne disponible utilise DRAC et gnash pour rebooter en appuyant sur F1
Notes:
- Il serait bien d'envoyer un SMS en plus des mails mais ça ne parait pas indispensable
- Si une machine ou un service est down pendant plusieurs heures parceque personne n'a pas relevé son mail, c'est la vie
- Si une échéance importante pour l'April demande que des ressources soient disponibles en permanence alors il serait bien de s'organiser pour faire des tours d'astreinte temporaires
Updated by Loïc Dachary about 12 years ago
- Subject changed from remonté des alertes to remonté des alertes lorsqu'un service ou une machine est planté
- Priority changed from Normale to Immédiate
Updated by Loïc Dachary about 12 years ago
- Status changed from Nouveau to En cours de traitement
- Assignee set to Loïc Dachary
- Target version changed from Backlog to Novembre 2012
- % Done changed from 0 to 80
Un serveur zabbix était planté et a été relancé par theo. C'était celui de
ssh -t -A root@ns1.april.org vserver ephedrine enter
La page décrivant l'installation zabbix a été modifiée pour mentionner l'alias mail sur lequel les alertes sont envoyées.
http://127.0.0.1:8080/dokuwiki/doku.php?id=sysadm:configuration:zabbix_install&do=revisions
Une modification de la charge des admin sys est proposée
http://127.0.0.1:8080/dokuwiki/doku.php?id=sysadm:equipe:charte&do=revisions
Updated by Loïc Dachary about 12 years ago
Ajout de nouveaux hosts sur zabbix tournant sur ns1.april.org pour vérifier la présence des vservers sur pavot:
Updated by Loïc Dachary about 12 years ago
comment monitorer les vhosts qui sont censés être la ?
http://blog.torbonium.com/index.php/2008/09/16/zabbix_and_monitoring_apache_gentoo_mod_?blog=10
- Ajouter un host
- Ajouter un scenario avec Configuration => Web => Create scenarios
Updated by Loïc Dachary about 12 years ago
http://127.0.0.1:8080/zabbix/httpmon.php monitor désormais tous les vhosts fournis par le vserver lamp de pavot.april.org tels que décrits sur http://127.0.0.1:8080/dokuwiki/doku.php?id=sysadm:machines_virtuelles:pavot:lamp
Updated by Loïc Dachary about 12 years ago
Documentation de la façon de monitorer un site web http://127.0.0.1:8080/dokuwiki/doku.php?id=sysadm:configuration:zabbix_install#check_web
Updated by Loïc Dachary about 12 years ago
- Target version changed from Novembre 2012 to Décembre 2012 (1/2)
Updated by Loïc Dachary about 12 years ago
- Target version changed from Décembre 2012 (1/2) to Backlog
Updated by Loïc Dachary almost 12 years ago
- Status changed from En cours de traitement to Fermé
il reste une immense quantité d'alerte a créer pour les services mais la remonté d'alerte en cas de panne matérielle est ok