Anomalie #3603
ferméRédémarrage difficile des vm de coon
0%
Description
Suite à un dist-upgrade de coon, le reboot a mal fonctionné : les vm n'ont pas démarré.
Un reboot supplémentaire a permis de tout faire rentrer dans l'ordre.
Le problème a été constaté lors des 2 derniers reboot de cluster.
Est-ce un problème de délai de boot ?
Premier boot (en erreur) :
cpm@ocmstar (23:32:36) ~ 7 > sshapril root@coon.chapril.org Linux coon.chapril.org 4.9.0-8-amd64 #1 SMP Debian 4.9.144-3 (2019-02-02) x86_64 The programs included with the Debian GNU/Linux system are free software; the exact distribution terms for each program are described in the individual files in /usr/share/doc/*/copyright. Debian GNU/Linux comes with ABSOLUTELY NO WARRANTY, to the extent permitted by applicable law. Last login: Mon Feb 18 23:28:17 2019 from 2a01:e35:2fb3:320:8b1:655c:53ff:a404 =(^-^)=root@coon:~# drbdadm primary coon =(^-^)=root@coon:~# mount /var/lib/libvirt/coon =(^-^)=root@coon:~# cd /etc/libvirt/qemu =(^-^)=root@coon:/etc/libvirt/qemu# for host in $(ls *xml | sed -e 's/.xml//g'| grep -v modele) ; do virsh start $host ; done error: Failed to start domain admin error: Cannot access storage file '/var/lib/libvirt/maine/admin.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type error: Failed to start domain bastion error: Cannot access storage file '/var/lib/libvirt/maine/bastion.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type error: Failed to start domain dns error: Requested operation is not valid: network 'default' is not active error: Failed to start domain lamp error: Requested operation is not valid: network 'default' is not active error: Failed to start domain libreoffice error: Requested operation is not valid: network 'default' is not active error: Failed to start domain mail error: Requested operation is not valid: network 'default' is not active error: Failed to start domain pad error: Cannot access storage file '/var/lib/libvirt/maine/pad.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type error: Failed to start domain pouet error: Cannot access storage file '/var/lib/libvirt/maine/pouet.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type error: Failed to start domain sympa error: Requested operation is not valid: network 'default' is not active =(^-^)=root@coon:/etc/libvirt/qemu# virsh list Id Name State ----------------------------------------------------
Deuxième boot (nominal) :
cpm@ocmstar (23:39:45) ~ 10 > sshapril root@coon.chapril.org Linux coon.chapril.org 4.9.0-8-amd64 #1 SMP Debian 4.9.144-3 (2019-02-02) x86_64 The programs included with the Debian GNU/Linux system are free software; the exact distribution terms for each program are described in the individual files in /usr/share/doc/*/copyright. Debian GNU/Linux comes with ABSOLUTELY NO WARRANTY, to the extent permitted by applicable law. Last login: Mon Feb 18 23:32:38 2019 from 2a01:e35:2fb3:320:8b1:655c:53ff:a404 =(^-^)=root@coon:~# drbdadm primary coon =(^-^)=root@coon:~# mount /var/lib/libvirt/coon =(^-^)=root@coon:~# cd /etc/libvirt/qemu =(^-^)=root@coon:/etc/libvirt/qemu# for host in $(ls *xml | sed -e 's/.xml//g'| grep -v modele) ; do virsh start $host ; done error: Failed to start domain admin error: Cannot access storage file '/var/lib/libvirt/maine/admin.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type error: Failed to start domain bastion error: Cannot access storage file '/var/lib/libvirt/maine/bastion.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type Domain dns started Domain lamp started Domain libreoffice started Domain mail started error: Failed to start domain pad error: Cannot access storage file '/var/lib/libvirt/maine/pad.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type error: Failed to start domain pouet error: Cannot access storage file '/var/lib/libvirt/maine/pouet.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type Domain sympa started
Mis à jour par Quentin Gibeaux il y a presque 6 ans
Quand ça a planté, as-tu pensé à vérifier que le serveur avait fini de démarrer ? (Genre journalctl -f)
Mis à jour par Christian P. Momon il y a presque 6 ans
- Statut changé de Nouveau à En cours de traitement
- Assigné à mis à Christian P. Momon
Je confirme n'avoir pas regardé. Je le ferai la prochaine fois.
Mis à jour par Christian P. Momon il y a presque 6 ans
- Statut changé de En cours de traitement à Attente d'information
Mis à jour par Quentin Gibeaux il y a plus de 5 ans
Autre astuce : systemctl status
Ça affiche
State: running, quand c'est fini de booter.
Mis à jour par Christian P. Momon il y a plus de 5 ans
Bien vu. Jusqu'ici je vérifiais dans les logs système la présence de « Startup » :
Jun 7 02:00:09 adl systemd[1]: Startup finished in 12.319s (kernel) + 2min 5.151s (userspace) = 2min 17.470s.
Du coup, c'est encore plus facile avec le status :D
Mis à jour par Christian P. Momon il y a plus de 5 ans
- Statut changé de Attente d'information à Résolu
Bilan après 4 mois en faisant attention à attendre la fin du démarrage du système avant de faire des actions : le problème n'est plus rencontré.
En conséquence, fermeture du ticket.
Mis à jour par Christian P. Momon il y a presque 5 ans
- Projet changé de Chapril à Infra Chapril
- Statut changé de Résolu à Fermé
Mis à jour par Christian P. Momon il y a plus de 4 ans
- Lié à Anomalie #4601: Redémarrage difficile des vm coon ajouté