Actions
Anomalie #977
fermédocumentation de la procédure de test après rackage
Début:
03/12/2016
Echéance:
% réalisé:
0%
Temps estimé:
Difficulté:
2 Facile
Description
A faire:
- Documenter dans http://127.0.0.1:8080/dokuwiki/doku.php la procédure de test a effectuer immédiatement après qu'une nouvelle machine a été placée dans un centre d'hébergement
- Référencer cette page afin qu'elle puisse être retrouvée
Ce qui est arrivé:
- Fred est en voyage a amsterdam (19 sept) avec une connection internet
- Il se rend compte que la machine pavot ne répond plus
- benj et aeris étaient la sur IRC ( voir #april-admin )
- tout le monde tente de rebooter via DRAC en mode console
- mais ça bloque
- il faut appuyer sur F1 en utilisant une applet Java
- pendant deux heures tout le monde cherche a faire tourner cette applet
- maxence était à madrid et ne pouvait pas intervenir sur le site de rennes et le contrat ne prévoit pas d'intervention sur site
- finalement c'est benj en utilisant un trikcs qui réussit à appuyer sur F1
Ce qui aurait du arriver:
- Pavot est installé a rennes
- Un test de reboot via DRAC est effectué
- Quelques heures de recherche conduisent a constater qu'il faut une applet java et appuyer sur F1 pour reboot
- Le process est documenté dans le wiki
- Pavot tombe
- Une alerte zabbix est déclenchée
- Un mail est envoyé aux admins
- Un admin disponible trouve sur le wiki les instructions pour rebooter pavot en utilisant l'applet java et appuyer sur F1
Actions