David Madore's WebLog: Serveur mort

Index of all entries / Index de toutes les entréesXML (RSS 1.0) • Recent comments / Commentaires récents

Entry #0965 [older|newer] / Entrée #0965 [précédente|suivante]:

(mercredi)

Serveur mort

[English translation follows.]

Le serveur dédié qui hébergeait www.madore.org est mort. Si vous lisez quand même ceci, c'est que j'ai fait pointer le domaine vers une machine de secours (il faudra quand même attendre une journée pour que les caches DNS se mettent à jour et que tout le monde arrive au bon endroit).

Plus exactement, c'est le disque dur du serveur qui est défectueux. (Enfin, c'est probablement le disque dur ; ça pourrait aussi être le chipset ATA ou la connectique, ou à la limite la couche logicielle de Linux. Le fait est que le noyau a signalé un dma_timer_expiry: dma status == 0x21 puis, plus tard, a provoqué un reset IDE, puis a cessé complètement de pouvoir lire et écrire sur le disque — mais le serveur continuait à tourner sur les données cachées en mémoire.) Les filesystems ont été corrompus, j'ai réussi à rebooter mais une tentative pour réparer les données n'a fait qu'empirer les choses (fsck a mouliné dans la semoule pendant une éternité à faire des corrections manifestement délirantes), et maintenant le serveur ne répond plus du tout.

J'ai demandé à l'hébergeur à faire valoir la garantie, et j'attends de savoir sa réaction avant de dire ce que je pense de lui.

Inutile de préciser que je ne suis pas très heureux de cet état de choses. Une machine qui meurt quatre jours après le début de son utilisation réelle, ce n'est pas très satisfaisant, quel que soit le responsable exact de cet état de fait. Je n'ai perdu aucune donnée (sauf les commentaires postés sur mon blog entre 4h du matin et la mort du serveur, s'il y en avait, mais c'est vraiment le cadet de mes soucis) mais il m'a fallu beaucoup de temps pour mettre en place la configuration sur une machine de secours (j'espère au moins qu'elle tiendra le coup, elle !) et je vais en perdre encore quand le serveur sera revenu en place (si l'hébergeur honore ses engagements) pour refaire sa configuration.

[Traduction anglaise de ci-dessus.]

The dedicated server that was hosting www.madore.org died. If you can still read this, it is because I let the domain point to a backup machine (it will still take a day before the DNS caches update and everyone lands in the right place).

More precisely, the server's hard drive is broken. (Well, it's probably the hard drive; it could also be the ATA chipset or the cables, or even the software bits in Linux. The fact is, the kernel signalled a dma_timer_expiry: dma status == 0x21 then, later, ran an IDE reset, then ceased completely to be able to read and write on the disk—but the server kept running on in-memory-cache data.) The filesystems were corrupted, I managed to reboot but an attempt to repair the data only got things worse (fsck ran uselessly for an incredibly long time, doing obviously crazy fixes), and now the server is simply not responding.

I asked the provider to claim the warranty, and I await their answer before I say what I think of them.

Needless to say, I am not very happy about this state of affairs. A machine that dies four days after it's put in real use is not a very satisfacory thing, whoever exactly may be responsible for this state of fact. I lost no data (except for the comments posted on my blog between 4AM and the server's death, if any, but that's the least of my worries) but it took me a long time to set up the configuration on the backup machine (I hope at least it will stand steady!) and I will lose some more (time) when the server is back in place (if the provider honors its commitments) to redo the configuration.

↑Entry #0965 [older|newer] / ↑Entrée #0965 [précédente|suivante]

Recent entries / Entrées récentesIndex of all entries / Index de toutes les entrées