Hier on a eu chaud
Hier vendredi 15 avril 2005, début d’après-midi sur le chemin du bureau…
13h48 : mon portable émet un bip signalant la réception d’un SMS. Il s’agit d’un message d’alerte de notre serveur aurillacois qui m’indique qu’il n’arrive plus à se connecter sur notre plate-forme d’hébergement parisienne. En gros : nos machines sont en rade. Traduction : JeuxVideo.com est inaccessible, de même que tous nos clients (JSports*, Teddy Toys, Cantal.com, etc..), et même nos mails ! Bref, c’est une catastrophe : notre dizaine de serveurs hébergeant tout ça ne répond plus à nos pings incessants.
14h : J’arrive au bureau : David, notre responsable tehcnique, avait évidemment contacté le data center dans la minute pour voir ce qui se passe. Réponse : un incendie s’est déclaré dans le data center, la salle de climatisation est en train de cramer. Nos machines ne sont pas touchées pour l’instant, mais comme la clim est HS, il a fallu éteindre toutes les machines (oui parce qu’un serveur ça chauffe et ça doit être refroidit sous peine d’être endommagé). Les pompiers sont en train de traiter l’incendie, mais ils ont fait évacuer le bâtiment, et en ont interdit l’accès à toute personne étrangère aux secours.
Bref, c’est la catastrophe : nos machines sont éteintes, il y a le feu (au sens propre comme au figuré), et on ne sait absolument pas quand on pourra remettre les machines en ordre de marche (si tant est qu’elles ne crament pas avec la salle de clim). A cet instant, on pense que le data center est rendu inutilisable puisque privé de climatisation. On n’espère qu’une chose : que les pompiers laisseront l’accès à nos techniciens pour qu’ils puissent récupérer les machines afin de les déplacer vers un autre data center tout proche. Ce qui implique de reconstruire toute l’architecture réseau, de remettre les serveurs d’applomb… On s’attend donc à être coupé pour au minimum de longues heures et au pire plusieurs jours !!!
A ce moment, on fait le point à Aurillac pour essayer de prendre des mesures ici pour parer au plus pressé. Mais force est de constater qu’on ne peut pas faire grand chose. On ne peut même pas mettre de message à l’attention des internautes pour leur expliquer ce qui se passe ! On ne peut vraiment rien faire… A part prévenir nos clients par téléphone… Le moral n’est pas au beau fixe dans l’équipe… Mot d’ordre : continuer quand même à bosser comme si on allait être rétabli bientôt.
15h : On est déjà HS depuis plus d’une heure. Conformément à ce qu’on avait prévu, on appelle toutes les heures le data center pour être tenu au courant de l’évolution. Cette fois-ci, les nouvelles sont plutôt rassurantes : les pompiers ont laissé les techniciens rentrer dans les locaux : a priori nos machines ne sont pas touchées (ouf !). Une salle de clim n’a par ailleurs pas été touchée par l’incendie (re-ouf !). On va donc essayer de redémarrer comme si de rien n’était en étant refroidit avec la nouvelle clim. Enfin, avant ça, il faut quand même vérifier toutes les installations électriques, mais aussi et surtout laisser se dissiper la chaleur due à l’incendie… Temps estimé : 2 à 3 heures…
Soulagement ici, on va peut-être pouvoir mettre à jour JeuxVideo.com pour le week-end ! Mais on ne crie pas victoire tant qu’on n’est pas de nouveau opérationnel : chaque minute où nos serveurs sont down est vécue comme un échec.
~16h : On s’aperçoit que nos machines sont en train de redémarrer : les techniciens ont donc fait plus vite que prévu. On s’aperçoit alors qu’elles ont été éteintes brutalement (coupure électrique!). Le frontal W3 ne redémarre pas. Les deux serveurs qui hébergent la base de données des forums peinent : ils checkent les bases, ça va durer une bonne demi-heure…
Mais on commence à respirer : les sites web de nos clients sont revenus, JeuxVideo.com également, nos mails fonctionnent à nouveau… Les forums vont repartir, et même W3 un peu plus tard après l’intervention d’un technicien…
~17h : notre serveur aurillacois m’envoie un SMS pour me signaler que tout est rentré dans l’ordre… Gros ouf de soulagement. Bravo aux techniciens d’Agarik qui ont agit avec sang froid et efficacité : exactement ce qu’on attend d’eux en pareil cas.
17h30 : je passe sur les forums de JeuxVideo.com : je vois qu’on se fait engueuler par nos lecteurs parce que le site était inaccessible. Ca va, tout est donc vraiment rentré dans l’ordre ! 🙂
*Jsports.fr qui a d’ailleurs été récompensé par un net d’or par la CCI au cours de la cérémonie éponyme qui se déroulait jeudi dernier au Village d’entreprises d’Aurillac.










Dinowan
le 16 avril 2005Joli récit, surtout le dernier chapitre, je l’ai vécu comme ça aussi 🙂
Robby
le 16 avril 2005Bonjour,
Si les serveurs qui stockaient Jv.com aurait été endommagés voir détruits, comment sa serait il passé ?
Kill all term processus
le 16 avril 2005Je vais donner mon avis, étant donné que jv.com n’avait aucun autres serveur disponible pour au moins heberger juste le site il aurait donc était obligé de prendre un serveur dédié dans un autre data center pour rendre le site accessible ensuiteil aurait fallu, je pense, pas mal de temps pour reup la base de donnée du site. ainsi que les configurations serveurs à faire.
Celà aurait donc pris plusieurs heures, voir même plusieurs jours(24h ou plus).
Kill all term processus
le 16 avril 2005En tout cas il est apréciable d’avoir une explication plus détaillé que sur la news de jv.com.
C’est fort agréable pour quelqu’un qui est ingénieur reseaux et microsoft d’avoir plus de renseignement que la simple news de jv.com ne mentionnant pas le moindre détail mise à part un incendie.
Kill all term processus
le 16 avril 2005Par ailleur, j’aimerais savoir si vos serveur sont dans le data center de REDBUS ou de NEUF TELECOM ?
tout deux situé à courbevois.
Lightman
le 16 avril 2005Killer> Tu cherches du boulot ou quoi ? Je trouve tes messages un peu bizarres. Je sais pas si je dois les interprêter comme une menace ?
Quant au fait que tu sois ingénieur réseau Microsoft : toutes mes félicitations, mais c’est pas trop le sujet.
Kill all term processus
le 17 avril 2005ah non, pas comme une menace du tout, ce n’était pas le but du tout. Je suis très curieux… car avant j’habitait COLOMBES(92) et les deux data center n’était pas très loin de cher moi et comme j’ai déjà pu avoir access aux deux je me demandais le quel avait bien pu avoir un tel incident.
et en ce qui concerne l’histoire du virus, c’était une question, car pour l’irc vous n’aviez pas envisagé que quelqu’un soit est assez de connaissance pour arriver à ce resultat, il aurait très bien pu s’en prendre au site plutôt que l’irc. Non, je ne cherche pas de boulot sinon je serais déjà venu vous voir bien que mes qualification ne correspondent pas à ce que vous recherchez.
Kill all term processus
le 17 avril 2005Par ailleur j’aimerais beaucoup pouvoir vous parler, serait-il possible ? j’ai quelques questions qui me serviront surement pour le devellopement de ma socièté dont je vous ferais part si vous acceptez.
Lightman
le 17 avril 2005Killer> Ok, je propose qu’on continue la conversation par mail afin déviter d’encombrer ce weblog…
Pour répondre sur l’IRC, le coût pour maintenir le chat de JeuxVideo.com (passer des patchs et colmater les nombreuses failles de sécurité, mais aussi modérer efficacement cet espace) était disproportionné par rapport à l’audience de cette rubrique (en baisse constante depuis l’avénement des messageries instantanées que les gens préfèrent utiliser en lieu et place des chats ou des irc, sauf exception).
Du coup, plutôt que de garder une rubrique mal entretenue, on a préféré la fermer (comme le Cercle plus récemment).
Kill all term processus
le 17 avril 2005Je vous contact sur le mail de jv.com.
merci, a+ 🙂
virginie
le 17 avril 2005Fort heureusement, c’est une histoire qui se finit bien :o)
Mais au fait, tu écris :
« *Jsports.fr qui a d’ailleurs été récompensé par un net d’or par la CCI au cours de la cérémonie éponyme qui se déroulait jeudi dernier au Village d’entreprises d’Aurillac. »
Sur quels critères les sites ont été jugés ?… J’ai cherché sur le site de la CCI, j’ai vu qu’ils avaient créé 5 catégories mais rien de plus…
Ils se sont basés sur le nombre de visiteurs, l’ergonomie, l’originalité…?
Lightman
le 17 avril 2005Virginie> Bonne question. Je ne crois pas que le nombre de visiteurs entre en ligne de compte. Mais l’ergonomie et l’originalité, sûrement. Et puis, il faut que le site soit relativement récent quand même… J’en profite pour préciser que j’ai refusé de faire partie du jury des nets d’or. Etant aussi prestataire internet, cette double fonction me parait incompatible avec celle de membre du jury des nets d’or.