[English translation follows.]
Le serveur dédié qui hébergeait www.madore.org
est
mort. Si vous lisez quand même ceci, c'est que j'ai fait pointer le
domaine vers une machine de secours (il faudra quand même attendre une
journée pour que les caches DNS se mettent à jour et que
tout le monde arrive au bon endroit).
Plus exactement, c'est le disque dur du serveur qui est défectueux.
(Enfin, c'est probablement le disque dur ; ça pourrait aussi
être le chipset ATA ou la connectique, ou à la limite la
couche logicielle de Linux. Le fait est que le noyau a signalé un
dma_timer_expiry: dma status == 0x21
puis, plus tard, a
provoqué un reset IDE, puis a cessé complètement de
pouvoir lire et écrire sur le disque — mais le serveur
continuait à tourner sur les données cachées en mémoire.) Les
filesystems ont été corrompus, j'ai réussi à rebooter mais une
tentative pour réparer les données n'a fait qu'empirer les choses
(fsck
a mouliné dans la semoule pendant une éternité à
faire des corrections manifestement délirantes), et maintenant le
serveur ne répond plus du tout.
J'ai demandé à l'hébergeur à faire valoir la garantie, et j'attends de savoir sa réaction avant de dire ce que je pense de lui.
Inutile de préciser que je ne suis pas très heureux de cet état de choses. Une machine qui meurt quatre jours après le début de son utilisation réelle, ce n'est pas très satisfaisant, quel que soit le responsable exact de cet état de fait. Je n'ai perdu aucune donnée (sauf les commentaires postés sur mon blog entre 4h du matin et la mort du serveur, s'il y en avait, mais c'est vraiment le cadet de mes soucis) mais il m'a fallu beaucoup de temps pour mettre en place la configuration sur une machine de secours (j'espère au moins qu'elle tiendra le coup, elle !) et je vais en perdre encore quand le serveur sera revenu en place (si l'hébergeur honore ses engagements) pour refaire sa configuration.
[Traduction anglaise de ci-dessus.]
The dedicated server that was hosting www.madore.org
died. If you can still read this, it is because I let the domain
point to a backup machine (it will still take a day before the
DNS caches update and everyone lands in the right
place).
More precisely, the server's hard drive is broken. (Well, it's
probably the hard drive; it could also be the
ATA chipset or the cables, or even the software
bits in Linux. The fact is, the kernel signalled a
dma_timer_expiry: dma status == 0x21
then, later, ran an
IDE reset, then ceased completely to be able to read and
write on the disk—but the server kept running on in-memory-cache
data.) The filesystems were corrupted, I managed to reboot but an
attempt to repair the data only got things worse (fsck
ran uselessly for an incredibly long time, doing obviously crazy
fixes), and now the server is simply not responding.
I asked the provider to claim the warranty, and I await their answer before I say what I think of them.
Needless to say, I am not very happy about this state of affairs. A machine that dies four days after it's put in real use is not a very satisfacory thing, whoever exactly may be responsible for this state of fact. I lost no data (except for the comments posted on my blog between 4AM and the server's death, if any, but that's the least of my worries) but it took me a long time to set up the configuration on the backup machine (I hope at least it will stand steady!) and I will lose some more (time) when the server is back in place (if the provider honors its commitments) to redo the configuration.