Anomalie #4577
Mis à jour par Christian P. Momon il y a plus de 4 ans
Ce mercredi soir, constat que : * des services web du SI April ne sont plus joignables (pad…) ; * des sauvegardes sont en cours mais leur suspension ne résout rien ; * calamus a une grosse charge ( > 10) ; * dans virtmanager le graphe cpu de la vm bot montre une activité certaine (pas les autres vm) ; * sur la vm bots, le processus redminbot est à 100 % ; * un systemctl restart redminbot débloque instantanément tout. État du processus redminbot avant le restart : <pre> top - 21:25:35 up 20 days, 16:20, 1 user, load average: 1,16, 1,16, 1,09 Tasks: 81 total, 2 running, 79 sleeping, 0 stopped, 0 zombie %Cpu(s): 85,4 us, 14,6 sy, 0,0 ni, 0,0 id, 0,0 wa, 0,0 hi, 0,0 si, 0,0 st MiB Mem : 483,2 total, 15,8 free, 141,0 used, 326,3 buff/cache MiB Swap: 952,0 total, 904,7 free, 47,2 used. 324,7 avail Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 11934 redmine+ 20 0 23300 13788 5700 R 99,9 2,8 133:26.43 redminebot.py 413 root 20 0 38628 13100 5256 S 0,3 2,6 23:44.23 python3 1 root 20 0 169724 7236 4620 S 0,0 1,5 2:17.79 systemd 2 root 20 0 0 0 0 S 0,0 0,0 0:00.17 kthreadd 3 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 rcu_gp 4 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 rcu_par_gp </pre> Pas de trace particulière dans les logs… Question : * que s'est-il passé ? * cela est-il déjà arrivé ? * cela arrive-t-il régulièrement ?