Einsatzszenario: Lesetest mit Befehlsdaueranalyse

In diesem Artikel möchten wir Ihnen anhand eines echten Szenarios zeigen, wofür der Lesetest mit Befehlsdaueranalyse gut ist und welche Fehler damit gefunden werden können, die andere Tests im Programm und klassische Festplattentests nicht aufzeigen.

Der Datenträger

Der fehlerhafte Datenträger ist eine Seagate ST5000DM000 mit 5TB Speicherplatz, verbaut in einem USB-Gehäuse und wurde zur Sicherung eines Serversystems verwendet. Die Festplatte ist im Wechsel mit 4 anderen Datenträgern seit einigen Jahren zusammen in einer hybriden Sicherungslösung im Einsatz.

Die Ausgangssituation

Der Datenträger wurde an dem zu sichernden Server angeschlossen und wurde von Windows® nicht mehr erkannt. Das Ein- und Ausschalten funktionierte, genauso wie die Stromzufuhr, problemlos. Jedoch war unter Windows® keine Reaktion zu erkennen. Anschließend wurde die Platte an toolstar®testLX angeschlossen und verschiedene Tests in Reihenfolge (niedrigste Belastung nach höchste Belastung) durchgeführt. Diese Reihenfolge ist extrem wichtig um einen stark defekten Datenträger möglichst früh ohne hohe Belastung erkennen zu können.

Test 1: SMART-Analyse inklusive Extra-Checks

Für den ersten Test wurde die SMART-Analyse inklusive der Extra-Checks der Attribute (neu ab Version 5.96) verwendet. Die SMART-Analyse liefert innerhalb weniger Sekunden die wichtigsten Werte zur Festplatte, inklusive einer Bewertung des Herstellers und von toolhouse. Die SMART-Analyse stellt keinen Lese- oder Schreibzugriff in den Datenbereich der Platte dar und wird nur vom Controller und dessen eigenem internen Speicher abgewickelt. Dadurch entsteht nur eine minimale Belastung für das gesamte Medium.

In diesem Fall zeigten die Werte der SMART-Analyse keine großen Auffälligkeiten. Zwar meldet die Platte bei der Luftstromtemperatur eine Warnung, das ist aber bei Berücksichtigung des Alters und des Attributs zu verstehen. Dieses Meldung kann auch von Datenträgern jeder Art kurz nach der Inbetriebnahme auftreten, wenn diese regelmäßig etwas heißer wird.

------------------------------------------------------------------------

  SMART-Status (laut Platte): okay
             Gesamtbewertung: mittel

       Lebensdauer übrig (%): No data available
       Stunden eingeschaltet: 15362
                              Bestanden: nicht über 100000
    Aus- und Einschaltzyklen: 274
                              Bestanden: nicht über 20000
       Geschriebene TB insg.: 324,6
                              Bestanden: nicht über 500
       Geschriebene TB insg.: 324,6
                              Bestanden: nicht über 454

          Letzter Selbsttest: kein Fehler oder noch kein Test durchgeführt


  Fitness-Attribute                                                             
  Name:                  ID:  akt  min Schwelle Typ roh          Bewertung
  Rohfehlerrate Lesen:   1:   114  98  6        F   68.044.936      
  Start/Stop-Zyklen:     4:   100  100 20       A   841        keine
  Reallozierte Sektoren: 5:   100  100 10       F   0          noch nicht bewertet
  Positionierfehlerrate: 7:   80   60  30       F   22.050.748.658  
  Anlaufwiederholungen: 10:   100  100 97       F   0          noch nicht bewertet
  Ein/Ausschalt-Zyklen: 12:   100  100 20       A   274        keine
  End-to-End error:     184:  100  100 99       A   0          noch nicht bewertet
  Luftstromtemperatur:  190:  58   50  45       A   42         mittel

  Performance-/Info-Attribute                                                   
                                Name: ID:  akt min Schwelle Typ roh             
                          Anlaufzeit: 3:   95  92  0        F   0               
                        Betriebszeit: 9:   83  83  0        A   15.362 Stunden  
            SATA Downshift Err.Count: 183: 100 100 0        A   0               
           Bericht.nichtbeheb.Fehler: 187: 100 100 0        A   0               
                     Befehls-Timeout: 188: 100 99  0        A   4.295.032.834   
                   Große Schreibhöhe: 189: 1   1   0        A   129             
            Erschütterungsfehlerrate: 191: 100 100 0        A   0               
            Ausschalt-Rückzug-Zyklen: 192: 100 100 0        A   13              
                     Ruhezone-Zyklen: 193: 100 100 0        A   1.334           
                          Temperatur: 194: 42  50  0        A   42 °C           
           Behob.Hardwarefehler(ECC): 195: 114 100 0        A   68.044.936      
  Auf Reallokation wartende Sektoren: 197: 100 100 0        A   0               
           N.behebb.Fehler (Offline): 198: 100 100 0        A   0               
             UltraDMA-CRC-Fehlerrate: 199: 200 200 0        A   0               
                     Kopfflugstunden: 240: 100 253 0        A   3124            
         Geschriebene Sektoren insg.: 241: 100 253 0        A   697.017.004.664 
             Gelesene Sektoren insg.: 242: 100 253 0        A   21.205.510.472  


Fehler-Logs
===========

  Insg. geloggte Fehler: 0

Test 2: Schneller Lesebenchmark

Der Schnelle Lesebenchmark liest linear mit gleichbleibenden Sprunggrößen der Sektoren auf der Festplatte gleichmäßig verteilt verschiedene Sektorblöcke und misst dabei die die Geschwindigkeit sowie die Fähigkeit den Sektor korrekt zu lesen. Bei diesem Test ist zwar bereits aufgefallen, dass die Festplatte langsamer als gewöhnlich sein könnte jedoch wurde kein Sektorfehler angegeben und der Test ordentlich beendet.

------------------------------------------------------------------------

           Plattendaten: 
               Sektoren: 1.220.942.646
            Sektorgröße: 4096 Bytes
              Kapazität: 4657 GB = 4,5 TB

       Angeschlossen an: Intel 8 Series USB xHCI Host Controller

   Zu testender Bereich: ganze Platte
    Benutzte Blockgröße: 256 Sektoren

  Geschwindigkeitswerte: 
                Maximum: 11.770 KB/s
           Durchschnitt: 11.570 KB/s
                Minimum: 11.314 KB/s

               Ergebnis: bestanden
Linear read test

Test 3: Mechaniktest und Zugriffszeit

Der Mechanik- und Zugriffszeit-Test springt nicht linear an verschiedene Sektorblöcke auf der Platte. Dabei wird geprüft, ob alle anvisierten Sektorblöcke zugreif- und lesbar sind. Bei diesem Test wurde kein Fehler festgestellt und der Test wurde in einer hinreichend schnellen Geschwindigkeit beendet.

------------------------------------------------------------------------

          Plattendaten: 
              Sektoren: 1.220.942.646
           Sektorgröße: 4096 Bytes
             Kapazität: 4657 GB = 4,5 TB

      Angeschlossen an: Intel 8 Series USB xHCI Host Controller

  Zu testender Bereich: ganze Platte
   Benutzte Blockgröße: 256 Sektoren

              Ergebnis: bestanden


Geschwindigkeit
---------------

  Durchschnittszeit: 17 ms
news_mechanik

Test 4: Lesetest mit Befehlsdaueranalyse

Der Lesetest an sich lieferte ebenso wie die anderen 3 Tests keinen Fehler. Erst die Befehlsdaueranalyse zeigte an, dass ab dem Sektorblock 5.120 die Reaktionszeit der Festplatte bei über 500ms lag. Eine Zahl von über 500ms in ersten Speicherbereich einer Festplatte kann innerhalb von Betriebssystem und Applikationen sehr schnell zu einem Timeout führen. Unter Windows könnte der Timeout vom Storage-Driver ausgelöst worden sein. In anderen Situationen könnten Sicherungsprogramme abstürzen oder die Sicherung aufgrund eines nicht bzw. in diesem Fall viel zu langsam reagierenden Speichermediums beenden.

------------------------------------------------------------------------

           Plattendaten: 
               Sektoren: 1.220.942.646
            Sektorgröße: 4096 Bytes
              Kapazität: 4657 GB = 4,5 TB

       Angeschlossen an: Intel 8 Series USB xHCI Host Controller

   Zu testender Bereich: ganze Platte
    Benutzte Blockgröße: 256 Sektoren

  Geschwindigkeitswerte: 
                Maximum: 40,1 MB/s
           Durchschnitt: 32,3 MB/s
                Minimum: 5.158 KB/s

               Ergebnis: abgebrochen* davor FEHLER


Meldungen
---------

  Block ab         5.120: FEHLER: Bereits 1x über 500 ms
  Block ab     1.037.312: Test durch Benutzer abgebrochen


Befehlsdauer-Analyse
--------------------

          < 100 ms: 4.032x
      100 - 250 ms: 0x
      250 - 500 ms: 0x
          > 500 ms: 11x
                    FEHLER: mehr als 500!

      Sektor 5.120: 3176 ms
     Sektor 21.504: 6388 ms
     Sektor 54.272: 12752 ms
    Sektor 119.808: 12744 ms
    Sektor 250.624: 12748 ms
    Sektor 381.696: 12748 ms
    Sektor 512.768: 13212 ms
    Sektor 643.840: 12700 ms
    Sektor 774.912: 12804 ms
    Sektor 905.984: 12716 ms
  Sektor 1.037.056: 12784 ms
default_read_test

Die Befehlsaueranalyse

Die Befehlsdaueranalyse ist bereits seit langer Zeit ein Teil der Software toolstar®testLX und toolstar®testWIN. Die Befehlsdaueranalyse wird in den Standardeinstellungen automatisch mit beim Lesetest durchgeführt. Bei dem Test lassen sich insgesamt 3 verschiedene Grenzwerte definieren. Standardmäßig sind hier 100, 250 und 500ms eingetragen. Zusätzlich zu den Grenzwerten kann noch festgelegt werden, welche Überschreitung und wenn ja, wie viele Überschreitungen dieser Grenzwerte während eines Tests zu einem Fehler führen. Standardmäßig wird nur der Grenzwert von 500ms berücksichtigt und bei der ersten Überschreitung wird ein Fehler generiert.