Projet

Général

Profil

Anomalie #4577

Mis à jour par Christian P. Momon il y a plus de 4 ans

Ce mercredi soir, constat que : 
 * des services web du SI April ne sont plus joignables (pad…) ; 
 * des sauvegardes sont en cours mais leur suspension ne résout rien ; 
 * calamus a une grosse charge ( > 10) ; 
 * dans virtmanager le graphe cpu de la vm bot montre une activité certaine (pas les autres vm) ; 
 * sur la vm bots, le processus redminbot est à 100 % ; 
 * un systemctl restart redminbot débloque instantanément tout. 

 État du processus redminbot avant le restart : 
 <pre> 
 top - 21:25:35 up 20 days, 16:20,    1 user,    load average: 1,16, 1,16, 1,09 
 Tasks:    81 total,     2 running,    79 sleeping,     0 stopped,     0 zombie 
 %Cpu(s): 85,4 us, 14,6 sy,    0,0 ni,    0,0 id,    0,0 wa,    0,0 hi,    0,0 si,    0,0 st 
 MiB Mem :      483,2 total,       15,8 free,      141,0 used,      326,3 buff/cache 
 MiB Swap:      952,0 total,      904,7 free,       47,2 used.      324,7 avail Mem  

   PID USER        PR    NI      VIRT      RES      SHR S    %CPU    %MEM       TIME+ COMMAND 
                                                                                                                                  
 11934 redmine+    20     0     23300    13788     5700 R    99,9     2,8 133:26.43 redminebot.py 
                                                                                                                              
   413 root        20     0     38628    13100     5256 S     0,3     2,6    23:44.23 python3 
                                                                                                                                      
     1 root        20     0    169724     7236     4620 S     0,0     1,5     2:17.79 systemd 
                                                                                                                                      
     2 root        20     0         0        0        0 S     0,0     0,0     0:00.17 kthreadd 
                                                                                                                                     
     3 root         0 -20         0        0        0 I     0,0     0,0     0:00.00 rcu_gp 
                                                                                                                                       
     4 root         0 -20         0        0        0 I     0,0     0,0     0:00.00 rcu_par_gp 
                                                                                                                               
 </pre> 

 Pas de trace particulière dans les logs… 

 Question : 
 * que s'est-il passé ? 
 * cela est-il déjà arrivé ? 
 * cela arrive-t-il régulièrement ?

Retour