Project

General

Profile

Actions

Anomalie #5276

closed

Erreurs aléatoires de backup

Added by Christian P. Momon over 3 years ago. Updated over 3 years ago.

Status:
Fermé
Priority:
Normale
Assignee:
Christian P. Momon
Category:
Sauvegardes
Start date:
03/12/2021
Due date:
% Done:

0%

Estimated time:

Description

Depuis le passage à Borgmatic (causalité non prouvée), des sauvegardes échouent aléatoirement sur les vm.
Voir les tickets #5216 et #5259.

Le 12/03/2021, c'est au tour de la vm pouet :

pouet.cluster.chapril.org
WARNING
Service: Backup
Plugin Output
root: Failed at 2021-03-12T07:07:40+01:00

Les précédents tickets ont été fermé car ça rentre dans l'ordre le jour d'après.
Mais aucune explication n'a été fournie.

Demande : trouver l'origine du problème et faire en sorte que ça n'arrive pas.


Related issues 4 (0 open4 closed)

Related to Infra Chapril - Anomalie #5216: Erreur à la sauvegarde de la vm bilizRejetéChristian P. Momon02/13/2021

Actions
Related to Infra Chapril - Anomalie #5259: Erreur de backup pour la vm dropFerméFrançois Poulain03/05/2021

Actions
Related to Infra Chapril - Anomalie #5203: Erreur de sauvegarde sur la vm adminFerméChristian P. Momon02/09/2021

Actions
Related to Infra Chapril - Demande #5130: Amélioration de la sonde icinga pour les backups :FerméFrançois Poulain01/16/2021

Actions
Actions #1

Updated by Christian P. Momon over 3 years ago

  • Category set to Sauvegardes
Actions #2

Updated by Christian P. Momon over 3 years ago

  • Related to Anomalie #5216: Erreur à la sauvegarde de la vm biliz added
Actions #3

Updated by Christian P. Momon over 3 years ago

Actions #4

Updated by Christian P. Momon over 3 years ago

  • Subject changed from Erreurs de backup aléatoires to Erreurs aléatoires de backup
Actions #5

Updated by Christian P. Momon over 3 years ago

Nouvelle alerte Icinga :

UP since Feb 7 pouet.cluster.chapril.org
WARNING since Mar 14 07:28 Service: Backup
Plugin Output root: Failed at 2021-03-14T07:24:01+01:00

Actions #6

Updated by François Poulain over 3 years ago

Les précédents tickets ont été fermé car ça rentre dans l'ordre le jour d'après.
Mais aucune explication n'a été fournie.

Si. L'explication est là : https://agir.april.org/issues/5203#note-1

C'est juste que depuis le passage à borgmatic on surveille mieux ces cas de figure.

Actions #7

Updated by Christian P. Momon over 3 years ago

  • Status changed from Nouveau to En cours de traitement

François Poulain a écrit :

Si. L'explication est là : https://agir.april.org/issues/5203#note-1

Une explication et un patch ont été fournis pour le cas #5203 mais pas pour les cas #5216 et #5259 (tickets vide d'explication, de ticket lié et de patch).

Puisque corrigé dans #5203, on pouvait penser que ça ne se reproduise pas.

Bien vu d'avoir pensé à #5203 \o/

C'est juste que depuis le passage à borgmatic on surveille mieux ces cas de figure.

Oui, l'explication du #5203 est super claire. Mais du coup la question devient :
  • que faut-il rajouter quoi dans l'exclude cette fois-ci ?
  • Ou alors est-il possible de modifier la sonde pour ignorer ce cas (parce que là on a l'impression que la sauvegarde a échoué alors nan) ?
Actions #8

Updated by François Poulain over 3 years ago

Puisque corrigé dans #5203, on pouvait penser que ça ne se reproduise pas.

Oui mais le fix de #5203 n'évite pas le cas général, qui peut toujours arriver, qu'un fichier a changé en cours de backup.

Mais du coup la question devient :
  • que faut-il rajouter quoi dans l'exclude cette fois-ci ?
  • Ou alors est-il possible de modifier la sonde pour ignorer ce cas (parce que là on a l'impression que la sauvegarde a échoué alors nan) ?

Ce qui est nécessaire pour bien traiter le sujet sera dans Borgmatic version bullseye. :) Cf le ticket #5130 : « si le retour de borg n'est pas 0 ; afficher le code de retour et sa signification (un code 1 engendre un warning et n'est pas bien grave) ».

Actions #9

Updated by Christian P. Momon over 3 years ago

  • Related to Anomalie #5203: Erreur de sauvegarde sur la vm admin added
Actions #10

Updated by Christian P. Momon over 3 years ago

  • Related to Demande #5130: Amélioration de la sonde icinga pour les backups : added
Actions #11

Updated by Christian P. Momon over 3 years ago

  • Status changed from En cours de traitement to Résolu
  • Assignee set to Christian P. Momon

Oki, j'ai tout compris, alors je passe ce ticket en résolu avec indication de se référer à 5130 à l'avenir.
Merci pour toutes les informations \o/

Actions #12

Updated by Quentin Gibeaux over 3 years ago

  • Status changed from Résolu to Fermé
Actions #13

Updated by Christian P. Momon over 3 years ago

  • Target version changed from Backlog to Sprint 2021 mars
Actions

Also available in: Atom PDF