Wieso Festplattenüberwachung?

Moderne Serversysteme speichern ihre Daten auf einem RAID, also nicht auf einer einzelnen Festplatte, sondern redundant auf mehreren Geräten. So kann im Fall eines Defekts einer Festplatte diese einfach ersetzt werden und die Daten aus den Informationen welche sich auf den anderen Festplatten des RAID-Verbundes befinden wiederhergestellt werden. Dies könnte zu dem Schluss führen, dass es unnötig ist eine Festplatte frühzeitig auszutauschen. Schließlich können die Daten ja aus der Redundanz des RAIDs wiederhergestellt werden.

Allerdings steigt die Ausfallwahrscheinlichkeit einer Festplatte mit der Belastung. Wird also ein RAID so betrieben, dass erst bei einem Defekt Datenträger ausgetauscht werden, so kann es vorkommen, dass bei der Wiederherstellung weitere Festplatten ausfallen. Dies ist durch die hohe Last an Leseoperationen bei der Wiederherstellung bedingt und könnte somit zu einem Komplettausfall des RAIDs und damit einhergehendem Datenverlust führen.

Die Festplattenüberwachung erkennt bereits kleinste Veränderungen im Betrieb der Datenträger und ermöglicht so ein frühzeitiges Eingreifen. Dazu werden mittels S.M.A.R.T. eine Vielzahl von Festplattenparametern ausgelesen. Diese geben beispielsweise an, wie viele korrigierbare Fehler beim Lesen aufgetreten sind, wie viel Daten bislang auf die Festplatte geschrieben wurden oder wie viele Daten-Blöcke noch als Reserve für defekte Blöcke reserviert sind. Werden hierbei Werte ausserhalb der von uns festgelegten Grenzen gemeldet, so wird innerhalb kurzer Zeit die betreffende Festplatte von einem Administrator ausgetauscht.

Defekte Blöcke - nicht zwangsläufig ein Problem

Einige defekte Blöcke, also Bereiche auf einer Festplatte, welche nicht mehr nutzbar sind, sind nicht ungewöhnlich. Dies hängt mit den Herstellungsprozessen von Festplatten zusammen und wird mit einer ausreichend großen Anzahl an Reserveblöcken von der Firmware der Geräte aufgefangen. Der entsprechnde Block wird einfach auf einen Reserverblock abgebildet. Steigt jedoch die Anzahl defekter Blöcke stark an, so ist ein Ausfall der Festplatte innerhalb kurzer Zeit zu erwarten. Wird dies von der Festplattenüberwachung erkannt, so kann ein Administrator die vermutlich bald defekte Festplatte bereits vorab austauschen.

Kein Ersatz für ein Backup

Ein RAID welches durch die Festplattenüberwachung abgesichert wird, verliert Daten sehr wahrscheinlich nicht aufgrund einer defekten Festplatte, wobei auch dies nicht auszuschließen ist. Jedoch kann auch die beste Festplattenüberwachung und das beste RAID nicht vor Datenverlusten durch Fehleingaben schützen. Ein regelmäßiges Backup gehört daher selbstverständlich immer zu unserem Server-Konzept.


Sie haben noch Fragen zum Thema?

Tralios IT GmbH