Actions
Anomalie #4577
ferméRedminbot s'emballe et paralyse le SI April
Début:
02/07/2020
Echéance:
% réalisé:
0%
Temps estimé:
Difficulté:
5 Difficile
Description
Ce mercredi soir, constat que :
- des services web du SI April ne sont plus joignables (pad…) ;
- des sauvegardes sont en cours mais leur suspension ne résout rien ;
- calamus a une grosse charge ( > 10) ;
- dans virtmanager le graphe cpu de la vm bot montre une activité certaine (pas les autres vm) ;
- sur la vm bots, le processus redminbot est à 100 % ;
- un systemctl restart redminbot débloque instantanément tout.
État du processus redminbot avant le restart :
top - 21:25:35 up 20 days, 16:20, 1 user, load average: 1,16, 1,16, 1,09 Tasks: 81 total, 2 running, 79 sleeping, 0 stopped, 0 zombie %Cpu(s): 85,4 us, 14,6 sy, 0,0 ni, 0,0 id, 0,0 wa, 0,0 hi, 0,0 si, 0,0 st MiB Mem : 483,2 total, 15,8 free, 141,0 used, 326,3 buff/cache MiB Swap: 952,0 total, 904,7 free, 47,2 used. 324,7 avail Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 11934 redmine+ 20 0 23300 13788 5700 R 99,9 2,8 133:26.43 redminebot.py 413 root 20 0 38628 13100 5256 S 0,3 2,6 23:44.23 python3 1 root 20 0 169724 7236 4620 S 0,0 1,5 2:17.79 systemd 2 root 20 0 0 0 0 S 0,0 0,0 0:00.17 kthreadd 3 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 rcu_gp 4 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 rcu_par_gp
Pas de trace particulière dans les logs…
Question :- que s'est-il passé ?
- cela est-il déjà arrivé ?
- cela arrive-t-il régulièrement ?
Actions