Projet

Général

Profil

Actions

Anomalie #1332

fermé

Achat d'un onduleur (Coupure des serveurs chez EE)

Ajouté par Quentin CHERGUI il y a plus de 11 ans. Mis à jour il y a environ 4 ans.

Statut:
Fermé
Priorité:
Immédiate
Assigné à:
Catégorie:
Task
Version cible:
Début:
22/07/2013
Echéance:
% réalisé:

80%

Temps estimé:
Difficulté:
2 Facile

Description

Ce matin, en arrivant, Opium et Scopolamine étaient coupés tous les deux : il faudrait voir s'il s'agit d'une coupure de courant, d'un coup de chaleur, ou d'autre chose.

Les machines ont été redémarrées.

Il a fallu 2 tentatives pour redémarrer Opium (problème habituel).
Pour Scopolamine, il a fallu couper complètement l'alimentation électrique (interrupteur de l'alim sur 0) avant qu'il ne veuille redémarrer. Étant donné qu'il s'agit d'une vieille machine, il va falloir songer à son remplacement.

S'il s'agit de coupures de courant, qui sont régulières, à voir si ça ne vaudrait pas le coup de mettre un onduleur.
Demande d'achat d'un onduleur confirmée : https://agir.april.org/issues/1332#note-4

Mis à jour par Quentin CHERGUI il y a plus de 11 ans

Derniers logs d'Opium à 19h05 dimanche, et 18h55 dimanche pour Scopolamine. Il semblerait que les machines se soient coupées en même temps. Problème électrique probable donc.

Dernières lignes visibles sur Opium :

Jul 21 19:05:01 opium /USR/SBIN/CRON[22249]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Jul 21 19:06:08 opium named[1438]: dumping master file: /etc/bind/zones/slaves/tmp-17RZePUtO6: open: permission denied

Dernières lignes visibles sur Scopolamine :

Jul 21 18:55:32 scopolamine kernel: DROP OUTPUT IN= OUT=eth0 SRC=192.168.3.2 DST=88.191.227.26 LEN=76 TOS=0x00 PREC=0x00 TTL=6
4 ID=0 DF PROTO=UDP SPT=123 DPT=123 LEN=56 

Mis à jour par Loïc Dachary il y a plus de 11 ans

  • Catégorie mis à Task
  • Assigné à mis à Quentin CHERGUI
  • Version cible mis à Juillet 2013

L'hypothèse de la panne electrique semble en effet la plus probable. C'est assez ennuyeux si ça arrive régulièrement, en effet. Disons que la prochaine fois que ça se produit on décide de l'action a prendre, si c'est dans moins de deux mois. Ca fera un total de trois pannes electriques sur de vieilles machines, c'est pas top.

Mis à jour par Quentin CHERGUI il y a plus de 11 ans

Nouvelle coupure cette nuit, vers 23h31.

Scopolamine a redémarré seul une fois le courant revenu (à 23h33). En revanche, Opium n'a pas redémarré tout seul à cause de ses problèmes de boot (cf https://agir.april.org/issues/1099#note-18).

Extraits logs Scopolamine :

Aug 13 23:24:58 scopolamine kernel: DROP OUTPUT IN= OUT=eth0 SRC=192.168.3.2 DST=80.74.64.1 LEN=76 TOS=0x00 PREC=0x00 TTL=64 I
D=0 DF PROTO=UDP SPT=123 DPT=123 LEN=56 
Aug 13 23:33:17 scopolamine syslogd 1.4.1#18: restart.
Aug 13 23:33:17 scopolamine kernel: klogd 1.4.1#18, log source = /proc/kmsg started.
Aug 13 23:33:17 scopolamine kernel: Linux version 2.6.18-6-486 (Debian 2.6.18.dfsg.1-24) (dannf@debian.org) (gcc version 4.1.2

Extrait logs Opium :

Aug 13 23:30:49 opium kernel: [1946903.345396] IPT :IN=eth2 OUT= MAC=01:00:5e:00:00:01:58:98:35:56:c6:b8:08:00 SRC=10.0.0.138 
DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0xC0 TTL=1 ID=5493 DF PROTO=2 
Aug 13 23:31:06 opium named[1648]: dumping master file: /etc/bind/zones/slaves/tmp-bFkWn0vg1f: open: permission denied
Aug 14 11:44:16 opium kernel: imklog 4.6.4, log source = /proc/kmsg started.

Mis à jour par Frédéric Couchet il y a plus de 11 ans

Un onduleur (UPS) pour au moins se prémunir des micro-coupures électriques est utile.

Idéalement, il faudrait un onduleur qui se connecte en USB aux machines pour leur indiquer la durée de vie restant de la batterie et leur permettre ainsi de s'éteindre proprement.

Chez Easter-Eggs ils ont des Powerware EATON 5110 utilisé avec (Network UPS Tools) en 100% libre selon eux.

Guerby indique sur irc qu'Easton que la quasi totalité de la gamme est supportée en libre et que le dev debian de NUT a été embauché par Easton. Voir la page de compatibilité matérielle de NUT et au pire contacter le développeur http://arnaud.quette.fr/

Mis à jour par Quentin CHERGUI il y a plus de 11 ans

  • Sujet changé de Coupure des serveurs chez EE à Achat d'un onduleur (Coupure des serveurs chez EE)
  • Statut changé de Résolu à En cours de traitement
  • Version cible changé de Juillet 2013 à Septembre 2013

Mis à jour par Quentin CHERGUI il y a plus de 11 ans

  • Version cible changé de Septembre 2013 à Backlog

Mis à jour par Quentin CHERGUI il y a plus de 11 ans

  • Assigné à Quentin CHERGUI supprimé

Mis à jour par François Poulain il y a environ 8 ans

  • Description mis à jour (diff)

Si vous investissez dons un onduleur, pensez aussi à onduler les équipements réseau (box, switch) et les machines dépourvues de batteries.

Mis à jour par Frédéric Couchet il y a environ 8 ans

Je ne compte pas m'en occuper.

Mis à jour par François Poulain il y a environ 8 ans

  • Statut changé de En cours de traitement à Fermé

Personne ne le fera alors :)

Mis à jour par Christian P. Momon il y a environ 4 ans

  • Assigné à mis à François Poulain
Actions

Formats disponibles : Atom PDF