Anomalie #3561
ferméRemettre en place configuration smartmontools / smartd sur laptop absinthe
100%
Description
Lors d'un récent apt upgrade sur mon laptop j'ai eu une erreur
« E: dpkg a étéinterrompu. Il est nécessaire d'utiliser « sudo dpkg --configure -a » pour corriger le problème. »
mais si j'exécutais la commande dpkg j'ai « dpkg: erreur: impossible d'accéder au répertoire administratif de dpkg: Système de fichiers accessible en lecture seulement »
La partition racine était passée en read-only : type ext4 (ro,relatime,errors=remount-ro)
Dmesg affichait :
[117083.700262] EXT4-fs error (device dm-1): ext4_validate_block_bitmap:376: comm dpkg: bg 11: bad block bitmap checksum [117083.703042] Aborting journal on device dm-1-8. [117083.705792] EXT4-fs (dm-1): Remounting filesystem read-only [117083.705799] EXT4-fs error (device dm-1) in ext4_free_blocks:4942: Filesystem failed CRC [117083.708665] EXT4-fs error (device dm-1): ext4_journal_check_start:61: Detected aborted journal [117083.711602] EXT4-fs error (device dm-1) in ext4_do_update_inode:5310: Journal has aborted [117083.714420] EXT4-fs error (device dm-1) in ext4_do_update_inode:5310: Journal has aborted [117083.717333] EXT4-fs error (device dm-1) in ext4_ext_remove_space:3061: IO failure [117083.720261] EXT4-fs error (device dm-1) in ext4_do_update_inode:5310: Journal has aborted [117083.722989] EXT4-fs error (device dm-1) in ext4_truncate:4526: IO failure [117083.725732] EXT4-fs error (device dm-1): ext4_evict_inode:293: comm dpkg: couldn't truncate inode 537475 (err -30) [117083.728460] EXT4-fs error (device dm-1) in ext4_evict_inode:304: IO failure
Le disque (un M2 SSD) est récent (octobre 2018).
J'ai rebooté en single, fsck, plein de fixes.
Après le reboot, exécution de smartctl -t long /dev/sda pour lancer un check, pas d'erreurs signalées.
Je me suis rendu compte alors, en vérifiant la configuration de smartmontools, qu'il n'y avait pas de self-test smartd planifiés via la config.
Modification de /etc/smartd.conf pour ajouter :
# First ATA/SATA or SCSI/SAS disk. Monitor all attributes, enable # automatic online data collection, automatic Attribute autosave, and # start a short self-test every day between 1-2pm, and a long self test # Saturdays between 1-2pm. /dev/sda -a -o on -S on -s (S/../.././13|L/../../6/13) -m fcouchet@april.org
Attention, j'avais un ligne DEVICESCAN définie avant dans le fichier et dans le fichier de configuration il est bien précisé :
# The word DEVICESCAN will cause any remaining lines in this # configuration file to be ignored: it tells smartd to scan for all # ATA and SCSI devices. DEVICESCAN may be followed by any of the # Directives listed below, which will be applied to all devices that # are found. Most users should comment out DEVICESCAN and explicitly # list the devices that they wish to monitor.
Donc, j'ai mis en commentaire la ligne DEVICESCAN.
Ensuite, pour vérifier la liste des tests à venir :
/etc/init.d/smartmontools stop /usr/sbin/smartd -q showtests Totals [Wed Jan 16 14:25:18 2019 CET - Tue Apr 16 15:25:18 2019 CEST]: Device: /dev/sda [SAT], will do 13 tests of type L Device: /dev/sda [SAT], will do 77 tests of type S /etc/init.d/smartmontools restart
Mis à jour par Frédéric Couchet il y a presque 6 ans
- Description mis à jour (diff)
- Assigné à mis à Frédéric Couchet
Mis à jour par Frédéric Couchet il y a presque 6 ans
- Tracker changé de Demande à Anomalie
Mis à jour par Quentin Gibeaux il y a presque 6 ans
- Version cible changé de Backlog à Janvier 2019
Mis à jour par Frédéric Couchet il y a presque 6 ans
- Statut changé de Nouveau à Résolu
- % réalisé changé de 0 à 100
visiblement le short self test smartd a bien eu lieu ce midi (dans daemon.log on a) :
Jan 17 14:41:13 absinthe smartd[32270]: Device: /dev/sda [SAT], starting scheduled Short Self-Test. Jan 17 14:58:35 absinthe smartd[32270]: Device: /dev/sda [SAT], previous self-test completed without error
L'horaire me surprend vu que dans smartd.conf j'ai /dev/sda -a -o on -S on -s (S/../.././13|L/../../6/13) -m fcouchet@april.org. Je pensais que 13 impliquerait 13h00. Mais visiblement c'est en UTC.