Zur Abwechslung mal ein englischer Titel, etwas besseres fiel mir heute früh nicht ein 😉 Worum geht’s eigentlich?

S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology) ist eigentlich eine feine Sache, bekommt man so doch hoffentlich rechtzeitig mit, das die Festplatte oder SSD im Sterben liegt. Damit das funktiuoniert müssen ein paar Dinge stimmig sein, die da wären:

Im BIOS des Computers muss das Feature vorhanden (i.d.R. Standard) und aktiviert sein. Im Falle von Servern oder RAID-Controllern und HBAs muss es ebenfalls unterstützt werden. So bekommt man bereits beim Starten des Systems meist eine Warnung wenn etwas nicht stimmt.

Im laufenden Betrieb muss eine Anwendung vorhanden sein, die die Werte ausliest sowie auswertet und ggf. eine Meldung anzeigt. Bei Intel kann das z.B. der RST-Treiber samt Tool sein, bei RAID-Controllern die entsprechenden Verwaltungstools, ansonsten gibt es noch Drittanbieter-Werkzeuge wie z.B. HWiNFO oder CrystalDiskInfo, uvm.

Die Erfahrung hat gezeigt, das meist zuerst fehlerhafte Blöcke bzw. Sektoren gemeldet werden und dann irgendwann später das Laufwerk nicht mehr ansprechbar ist. Bei manchen SSDs, z.B. von Intel, bekommt man vorab eine Meldung, dass das Lebensende naht. So oder so hat man in diesen Fällen meist etwas Zeit, die Daten zu sichern und das Laufwerk zu ersetzen. Speziell bei SSDs kann allerdings der Ausfall, im Gegenstz zur guten alten Festplatte, dann recht schnell kommen. Man sollte also nicht allzu lange warten.

Soweit der Idealfall. Leider gibt es immer mal wieder seltsames. Auch S.M.A.R.T. sieht und findet nicht alles, Überraschungen kann es immer und jederzeit geben. So hatten wir, bei klassischen mechanischen Festplatten oft schon fehlerhafte Blöcke ohne das die Selbstdiagnose etwas davon mitbekommen oder angemeckert hatte. Diese äußerten sich in merkwürdigen Verhalten des Computers wie Langsam, kurz Hängen bleiben/Stocken, Abstürzen, langsames Starten, usw.

So manchen Fehler sah man erst bei einer mehr oder weniger eingehenden Diagnose (chkdsk, HD Tune, den Surface Test in MiniTool Partition Wizard und Co., in Verbindung mit der Datensicherung wie z.B. mit Drive Snapshot, usw.).

Eine erst kürzlich ereignete Kuriosität wurde ebenfalls dokumentiert:

Windows: PC stürzt bei der Datensicherung mit Veeam Agent for Windows ab, mit Macrium Reflect nicht

Ein paar Wochen später war die SSD dann tatsächlich defekt.

Manchmal ist die Sache allerdings auch etwas unschlüssig:

Bei uns im RZ gibt es ein System mit zwei 4 TB HDDs, im alten Server meldete S.M.A.R.T. für eine der beiden Laufwerke Fehler. Eine weitere Diagnose zeigte allerdings keine Auffälligkeiten. Nach der Migration des betroffenen Servers und dem Umzug der HDDs in ein neues Gerät wurden keine Fehler mehr gemeldet.

Auf einem Kundenserver meldet CrystalDiskInfo für eine von zwei SSDs Fehler, wiederum Intel RST, sowie HWiNFO und weitere melden keine Fehler. Wer lügt nun?

Im Großen und Ganzen ist und bleibt S.M.A.R.T. eine feine Sache, dennoch darf man nicht alles Glauben was man sieht.

Update 15.10.2020

Kaum veröffentlicht, schon ein kleiner Nachtrag:

Wird eine Festplatte oder SSD mittels USB-Adapter an einen Computer angeschlossen, gelten nicht die Voraussetzungen wie eingangs erwähnt, vielmehr muss der USB-Adapter sozusagen das Durchreichen von S.M.A.R.T. unterstützen. Ebenso verhält es sich mit sogenannten USB-Docks bzw. Dockingstations. Gleiches gilt (leider) auch für so manchen eSATA-Anschluss-Adapter und weitere externe Laufwerksgehäusen.