Projet

Général

Profil

Actions

Anomalie #3603

fermé

Rédémarrage difficile des vm de coon

Ajouté par Christian P. Momon il y a presque 6 ans. Mis à jour il y a presque 5 ans.

Statut:
Fermé
Priorité:
Normale
Assigné à:
Christian P. Momon
Catégorie:
-
Version cible:
-
Début:
19/02/2019
Echéance:
% réalisé:

0%

Temps estimé:

Description

Suite à un dist-upgrade de coon, le reboot a mal fonctionné : les vm n'ont pas démarré.
Un reboot supplémentaire a permis de tout faire rentrer dans l'ordre.
Le problème a été constaté lors des 2 derniers reboot de cluster.
Est-ce un problème de délai de boot ?

Premier boot (en erreur) :

cpm@ocmstar (23:32:36) ~ 7 > sshapril root@coon.chapril.org
Linux coon.chapril.org 4.9.0-8-amd64 #1 SMP Debian 4.9.144-3 (2019-02-02) x86_64

The programs included with the Debian GNU/Linux system are free software;
the exact distribution terms for each program are described in the
individual files in /usr/share/doc/*/copyright.

Debian GNU/Linux comes with ABSOLUTELY NO WARRANTY, to the extent
permitted by applicable law.
Last login: Mon Feb 18 23:28:17 2019 from 2a01:e35:2fb3:320:8b1:655c:53ff:a404
=(^-^)=root@coon:~# drbdadm primary coon
=(^-^)=root@coon:~# mount /var/lib/libvirt/coon
=(^-^)=root@coon:~# cd /etc/libvirt/qemu
=(^-^)=root@coon:/etc/libvirt/qemu# for host in $(ls *xml | sed -e 's/.xml//g'| grep -v modele) ; do virsh start $host ; done
error: Failed to start domain admin
error: Cannot access storage file '/var/lib/libvirt/maine/admin.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type

error: Failed to start domain bastion
error: Cannot access storage file '/var/lib/libvirt/maine/bastion.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type

error: Failed to start domain dns
error: Requested operation is not valid: network 'default' is not active

error: Failed to start domain lamp
error: Requested operation is not valid: network 'default' is not active

error: Failed to start domain libreoffice
error: Requested operation is not valid: network 'default' is not active

error: Failed to start domain mail
error: Requested operation is not valid: network 'default' is not active

error: Failed to start domain pad
error: Cannot access storage file '/var/lib/libvirt/maine/pad.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type

error: Failed to start domain pouet
error: Cannot access storage file '/var/lib/libvirt/maine/pouet.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type

error: Failed to start domain sympa
error: Requested operation is not valid: network 'default' is not active

=(^-^)=root@coon:/etc/libvirt/qemu# virsh list
 Id    Name                           State
----------------------------------------------------

Deuxième boot (nominal) :

cpm@ocmstar (23:39:45) ~ 10 > sshapril root@coon.chapril.org
Linux coon.chapril.org 4.9.0-8-amd64 #1 SMP Debian 4.9.144-3 (2019-02-02) x86_64

The programs included with the Debian GNU/Linux system are free software;
the exact distribution terms for each program are described in the
individual files in /usr/share/doc/*/copyright.

Debian GNU/Linux comes with ABSOLUTELY NO WARRANTY, to the extent
permitted by applicable law.
Last login: Mon Feb 18 23:32:38 2019 from 2a01:e35:2fb3:320:8b1:655c:53ff:a404
=(^-^)=root@coon:~# drbdadm primary coon
=(^-^)=root@coon:~# mount /var/lib/libvirt/coon
=(^-^)=root@coon:~# cd /etc/libvirt/qemu
=(^-^)=root@coon:/etc/libvirt/qemu# for host in $(ls *xml | sed -e 's/.xml//g'| grep -v modele) ; do virsh start $host ; done
error: Failed to start domain admin
error: Cannot access storage file '/var/lib/libvirt/maine/admin.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type

error: Failed to start domain bastion
error: Cannot access storage file '/var/lib/libvirt/maine/bastion.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type

Domain dns started

Domain lamp started

Domain libreoffice started

Domain mail started

error: Failed to start domain pad
error: Cannot access storage file '/var/lib/libvirt/maine/pad.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type

error: Failed to start domain pouet
error: Cannot access storage file '/var/lib/libvirt/maine/pouet.qcow2' (as uid:64055, gid:64055): Aucun fichier ou dossier de ce type

Domain sympa started


Demandes liées 1 (0 ouverte1 fermée)

Lié à Infra Chapril - Anomalie #4601: Redémarrage difficile des vm coonFerméChristian P. Momon15/07/2020

Actions

Mis à jour par Quentin Gibeaux il y a presque 6 ans

Quand ça a planté, as-tu pensé à vérifier que le serveur avait fini de démarrer ? (Genre journalctl -f)

Mis à jour par Christian P. Momon il y a presque 6 ans

  • Statut changé de Nouveau à En cours de traitement
  • Assigné à mis à Christian P. Momon

Je confirme n'avoir pas regardé. Je le ferai la prochaine fois.

Mis à jour par Christian P. Momon il y a presque 6 ans

  • Statut changé de En cours de traitement à Attente d'information

Mis à jour par Quentin Gibeaux il y a plus de 5 ans

Autre astuce : systemctl status
Ça affiche

State: running
, quand c'est fini de booter.

Mis à jour par Christian P. Momon il y a plus de 5 ans

Bien vu. Jusqu'ici je vérifiais dans les logs système la présence de « Startup » :

Jun  7 02:00:09 adl systemd[1]: Startup finished in 12.319s (kernel) + 2min 5.151s (userspace) = 2min 17.470s.

Du coup, c'est encore plus facile avec le status :D

Mis à jour par Christian P. Momon il y a plus de 5 ans

  • Statut changé de Attente d'information à Résolu

Bilan après 4 mois en faisant attention à attendre la fin du démarrage du système avant de faire des actions : le problème n'est plus rencontré.

En conséquence, fermeture du ticket.

Mis à jour par Christian P. Momon il y a presque 5 ans

  • Projet changé de Chapril à Infra Chapril
  • Statut changé de Résolu à Fermé

Mis à jour par Christian P. Momon il y a plus de 4 ans

Actions

Formats disponibles : Atom PDF