Projet

Général

Profil

Actions

Anomalie #3561

fermé

Remettre en place configuration smartmontools / smartd sur laptop absinthe

Ajouté par Frédéric Couchet il y a presque 6 ans. Mis à jour il y a presque 6 ans.

Statut:
Fermé
Priorité:
Normale
Assigné à:
Catégorie:
-
Version cible:
Début:
16/01/2019
Echéance:
% réalisé:

100%

Temps estimé:
Difficulté:
2 Facile

Description

Lors d'un récent apt upgrade sur mon laptop j'ai eu une erreur

« E: dpkg a étéinterrompu. Il est nécessaire d'utiliser « sudo dpkg --configure -a » pour corriger le problème. »

mais si j'exécutais la commande dpkg j'ai « dpkg: erreur: impossible d'accéder au répertoire administratif de dpkg: Système de fichiers accessible en lecture seulement »

La partition racine était passée en read-only : type ext4 (ro,relatime,errors=remount-ro)

Dmesg affichait :

[117083.700262] EXT4-fs error (device dm-1): ext4_validate_block_bitmap:376: comm dpkg: bg 11: bad block bitmap checksum
[117083.703042] Aborting journal on device dm-1-8.
[117083.705792] EXT4-fs (dm-1): Remounting filesystem read-only
[117083.705799] EXT4-fs error (device dm-1) in ext4_free_blocks:4942: Filesystem failed CRC
[117083.708665] EXT4-fs error (device dm-1): ext4_journal_check_start:61: Detected aborted journal
[117083.711602] EXT4-fs error (device dm-1) in ext4_do_update_inode:5310: Journal has aborted
[117083.714420] EXT4-fs error (device dm-1) in ext4_do_update_inode:5310: Journal has aborted
[117083.717333] EXT4-fs error (device dm-1) in ext4_ext_remove_space:3061: IO failure
[117083.720261] EXT4-fs error (device dm-1) in ext4_do_update_inode:5310: Journal has aborted
[117083.722989] EXT4-fs error (device dm-1) in ext4_truncate:4526: IO failure
[117083.725732] EXT4-fs error (device dm-1): ext4_evict_inode:293: comm dpkg: couldn't truncate inode 537475 (err -30)
[117083.728460] EXT4-fs error (device dm-1) in ext4_evict_inode:304: IO failure

Le disque (un M2 SSD) est récent (octobre 2018).

J'ai rebooté en single, fsck, plein de fixes.

Après le reboot, exécution de smartctl -t long /dev/sda pour lancer un check, pas d'erreurs signalées.

Je me suis rendu compte alors, en vérifiant la configuration de smartmontools, qu'il n'y avait pas de self-test smartd planifiés via la config.

Modification de /etc/smartd.conf pour ajouter :

# First ATA/SATA or SCSI/SAS disk.  Monitor all attributes, enable
# automatic online data collection, automatic Attribute autosave, and
# start a short self-test every day between 1-2pm, and a long self test
# Saturdays between 1-2pm.
/dev/sda -a -o on -S on -s (S/../.././13|L/../../6/13) -m fcouchet@april.org

Attention, j'avais un ligne DEVICESCAN définie avant dans le fichier et dans le fichier de configuration il est bien précisé :

# The word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices.  DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found.  Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.

Donc, j'ai mis en commentaire la ligne DEVICESCAN.

Ensuite, pour vérifier la liste des tests à venir :

/etc/init.d/smartmontools stop

/usr/sbin/smartd -q showtests

Totals [Wed Jan 16 14:25:18 2019 CET - Tue Apr 16 15:25:18 2019 CEST]:
Device: /dev/sda [SAT], will do  13 tests of type L
Device: /dev/sda [SAT], will do  77 tests of type S

/etc/init.d/smartmontools restart

Mis à jour par Frédéric Couchet il y a presque 6 ans

  • Description mis à jour (diff)
  • Assigné à mis à Frédéric Couchet

Mis à jour par Frédéric Couchet il y a presque 6 ans

  • Tracker changé de Demande à Anomalie

Mis à jour par Quentin Gibeaux il y a presque 6 ans

  • Version cible changé de Backlog à Janvier 2019

Mis à jour par Frédéric Couchet il y a presque 6 ans

  • Statut changé de Nouveau à Résolu
  • % réalisé changé de 0 à 100

visiblement le short self test smartd a bien eu lieu ce midi (dans daemon.log on a) :

Jan 17 14:41:13 absinthe smartd[32270]: Device: /dev/sda [SAT], starting scheduled Short Self-Test.
Jan 17 14:58:35 absinthe smartd[32270]: Device: /dev/sda [SAT], previous self-test completed without error

L'horaire me surprend vu que dans smartd.conf j'ai /dev/sda -a -o on -S on -s (S/../.././13|L/../../6/13) -m . Je pensais que 13 impliquerait 13h00. Mais visiblement c'est en UTC.

Mis à jour par Quentin Gibeaux il y a presque 6 ans

  • Statut changé de Résolu à Fermé
Actions

Formats disponibles : Atom PDF