Donnerstag, 27. Oktober 2011

Serverausfall am 26. Oktober 2011


 Warum war paycloud.de eigentlich einen halben Tag offline?

Grund dafür war eine defekte Festplatte in unserem  Server. Da wir mehrere Festplatten in einem RAID System verwenden stellt dies eigentlich zunächst kein Problem dar. RAID bedeutet in diesem Fall, dass wir die Daten redundant auf mehrere Platten geschrieben werden. Dies erhöht, neben unseren verschiedenen Backups, die Sicherheit der Daten und die Verfügbarkeit des Systems.

Nachdem die defekte Platte im Rechenzentrum getauscht wurde, bestand das triviale Problem darin, dass uns das Rechenzentrum nicht über den Abschluss der Arbeiten informierte und ein automatischer Neustart des Servers wohl nicht üblich ist in einer solchen Situation. Das technische Problem war also schnell behoben, es scheiterte nur an der Kommunikation mit dem Rechenzentrum.