Anomalie #5276
ferméErreurs aléatoires de backup
0%
Description
Depuis le passage à Borgmatic (causalité non prouvée), des sauvegardes échouent aléatoirement sur les vm.
Voir les tickets #5216 et #5259.
Le 12/03/2021, c'est au tour de la vm pouet :
pouet.cluster.chapril.org WARNING Service: Backup Plugin Output root: Failed at 2021-03-12T07:07:40+01:00
Les précédents tickets ont été fermé car ça rentre dans l'ordre le jour d'après.
Mais aucune explication n'a été fournie.
Demande : trouver l'origine du problème et faire en sorte que ça n'arrive pas.
Mis à jour par Christian P. Momon il y a plus de 3 ans
- Lié à Anomalie #5216: Erreur à la sauvegarde de la vm biliz ajouté
Mis à jour par Christian P. Momon il y a plus de 3 ans
- Lié à Anomalie #5259: Erreur de backup pour la vm drop ajouté
Mis à jour par Christian P. Momon il y a plus de 3 ans
- Sujet changé de Erreurs de backup aléatoires à Erreurs aléatoires de backup
Mis à jour par Christian P. Momon il y a plus de 3 ans
Nouvelle alerte Icinga :
UP since Feb 7 pouet.cluster.chapril.org WARNING since Mar 14 07:28 Service: Backup Plugin Output root: Failed at 2021-03-14T07:24:01+01:00
Mis à jour par François Poulain il y a plus de 3 ans
Les précédents tickets ont été fermé car ça rentre dans l'ordre le jour d'après.
Mais aucune explication n'a été fournie.
Si. L'explication est là : https://agir.april.org/issues/5203#note-1
C'est juste que depuis le passage à borgmatic on surveille mieux ces cas de figure.
Mis à jour par Christian P. Momon il y a plus de 3 ans
- Statut changé de Nouveau à En cours de traitement
François Poulain a écrit :
Si. L'explication est là : https://agir.april.org/issues/5203#note-1
Une explication et un patch ont été fournis pour le cas #5203 mais pas pour les cas #5216 et #5259 (tickets vide d'explication, de ticket lié et de patch).
Puisque corrigé dans #5203, on pouvait penser que ça ne se reproduise pas.
Bien vu d'avoir pensé à #5203 \o/
Oui, l'explication du #5203 est super claire. Mais du coup la question devient :C'est juste que depuis le passage à borgmatic on surveille mieux ces cas de figure.
- que faut-il rajouter quoi dans l'exclude cette fois-ci ?
- Ou alors est-il possible de modifier la sonde pour ignorer ce cas (parce que là on a l'impression que la sauvegarde a échoué alors nan) ?
Mis à jour par François Poulain il y a plus de 3 ans
Puisque corrigé dans #5203, on pouvait penser que ça ne se reproduise pas.
Oui mais le fix de #5203 n'évite pas le cas général, qui peut toujours arriver, qu'un fichier a changé en cours de backup.
Mais du coup la question devient :
- que faut-il rajouter quoi dans l'exclude cette fois-ci ?
- Ou alors est-il possible de modifier la sonde pour ignorer ce cas (parce que là on a l'impression que la sauvegarde a échoué alors nan) ?
Ce qui est nécessaire pour bien traiter le sujet sera dans Borgmatic version bullseye. :) Cf le ticket #5130 : « si le retour de borg n'est pas 0 ; afficher le code de retour et sa signification (un code 1 engendre un warning et n'est pas bien grave) ».
Mis à jour par Christian P. Momon il y a plus de 3 ans
- Lié à Anomalie #5203: Erreur de sauvegarde sur la vm admin ajouté
Mis à jour par Christian P. Momon il y a plus de 3 ans
- Lié à Demande #5130: Amélioration de la sonde icinga pour les backups : ajouté
Mis à jour par Christian P. Momon il y a plus de 3 ans
- Statut changé de En cours de traitement à Résolu
- Assigné à mis à Christian P. Momon
Oki, j'ai tout compris, alors je passe ce ticket en résolu avec indication de se référer à 5130 à l'avenir.
Merci pour toutes les informations \o/
Mis à jour par Christian P. Momon il y a plus de 3 ans
- Version cible changé de Backlog à Sprint 2021 mars