Projet

Général

Profil

Actions

Anomalie #1089

fermé

interruption pavot.april.org suite a un overflow de oom-killer dans les vservers

Ajouté par Loïc Dachary il y a plus de 11 ans. Mis à jour il y a environ 5 ans.

Statut:
Fermé
Priorité:
Normale
Assigné à:
Catégorie:
Task
Version cible:
Début:
10/12/2012
Echéance:
14/12/2012
% réalisé:

100%

Temps estimé:
(Total: 0:00 h)
Temps passé:
3:00 h (Total: 18:00 h)
Difficulté:
2 Facile

Description

Diagnostic

Juste avant l'arret de pavot.april.org il y a un oom-killer
Dec 10 18:33:51 pavot kernel: [292373.923965] Killed process amavisd-new(27372:#16)

qui est précédé de nombreux autres dans la même journée. #16 dit que le process 27372 du contexte vserver 16 a été tué. Il semble que cela provienne d'une instabilité de vserver:

Solution

  • augmentation des limites /etc/vservers/.../rlimits/rss....
    • les vservers traitant le spam et le mail on besoin de beaucoup de memoire, mail a ~9GB, spamvir ~8GB
    • nginx bien que peu gourmand arrive a bout de ses 512MB de RAM en cas d'affluence, on lui donne 1GB
    • amphetamine herberge redmine: on lui donne 2 x de RAM mais ca ne servira que ponctuellement, lorsque redmine devient gourmand
      Les limites actuelles sont (en MB):
      /etc/vservers/amphetamine/rlimits/rss.hard : 1953
      /etc/vservers/bots/rlimits/rss.hard : 585
      /etc/vservers/dns/rlimits/rss.hard : 585
      /etc/vservers/ergine/rlimits/rss.hard : 585
      /etc/vservers/harmine/rlimits/rss.hard : 1953
      /etc/vservers/lamp/rlimits/rss.hard : 585
      /etc/vservers/mail/rlimits/rss.hard : 9375
      /etc/vservers/nginx/rlimits/rss.hard : 1171
      /etc/vservers/spamvir/rlimits/rss.hard : 7812
      total = 24604
      
  • ajout d'une sonde nagios qui alerte lorsque oom-killer se met en route sur pavot.april.org
  • documenter l'action corrective a prendre ( a) chercher la raison, b) augmenter la limite hard s'il faut )

Alternatives

  • suppression des limites /etc/vservers/*/rlimits/rss.*

TODO


Sous-tâches 1 (0 ouverte1 fermée)

Anomalie #1090: classe puppet pour oomkillerFerméLoïc Dachary10/12/201214/12/2012

Actions

Demandes liées 1 (0 ouverte1 fermée)

Lié à Admins - Demande #1065: echéance 10 et 11 décembre 2012FerméLoïc Dachary10/12/201211/12/2012

Actions
Actions

Formats disponibles : Atom PDF