Okosabb vagy-e mint a S.M.A.R.T. ?

Felmerült már többször mostanában, hogy mire jó a S.M.A.R.T. és mit is jelentenek az értékei.
Főleg a leggyakrabban előforduló “
Raw_Read_Error_Rate” (1) és a “Hardware_ECC_Recovered” (195) attributum.

Ha jól értelmezem az új HDD technológiákat és a S.M.A.R.T.-ot, akkor ezek nem “hibák” [nézőpont kérdése… én tiltakozom…].

Az egyik (nemrég cserélt) Seagate HDD-re a “smartctl -a” azt mondja, hogy:

Device Model:     ST3500320AS
Serial Number:    9QM0BEJ3
Firmware Version: SD15
User Capacity:    500.107.862.016 bytes

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   117   099   006    Pre-fail  Always       –       157989864
  3 Spin_Up_Time            0x0003   094   094   000    Pre-fail  Always       –       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       –       44
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       –       0
  7 Seek_Error_Rate         0x000f   074   060   030    Pre-fail  Always       –       25943365226
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       –       1550
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       –       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       –       44
184 Unknown_Attribute       0x0032   100   100   099    Old_age   Always       –       0
187 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       –       0
188 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       –       0
189 Unknown_Attribute       0x003a   099   099   000    Old_age   Always       –       1
190 Temperature_Celsius     0x0022   055   048   045    Old_age   Always       –       807600173
194 Temperature_Celsius     0x0022   045   052   000    Old_age   Always       –       45 (Lifetime Min/Max 0/15)
195 Hardware_ECC_Recovered  0x001a   054   048   000    Old_age   Always       –       157989864
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       –       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      –       0

199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       –       0

Meg persze a logot is teleírkálja a megfelelő entry-kkel.

Namármost a kék elméletileg nem gond.

Az aktuális HDD technológia ill. a S.M.A.R.T. elméletileg úgy működik, hogy:

Beolvassuk szektort. Sikerült, jó az adat? Igen –> Király, goto vége.

Ha nem sikerült, akkor a beolvasott adatból meg a szektor mellé olvasott ECC-ből össze tudjuk rakni, hogy minek kéne lennie a szektor tartalmának?

Ha igen, akkor a Raw_Read_Error_Rate (1) és/vagy Hardware_ECC_Recovered (195) változókat növeljük.

MInt látható, a fenti diszken van mindkettő, és minkettő ugyanannyi, 157 millió akárhány. Szerintem ez 1550 órára vetítve problémásan sok, de hát ez a csodás a S.M.A.R.T. technológiában, hogyha a gyártó úgy gondolja, hogy az nem probléma, akkor nem az…

Alább a Hitachinál csak Raw_Read_Error_Rate (1) van (bár itt “csak” 1.5 millió esemény történt 1548 óra alatt), még lejebb a Samsungnál van ugyan mindkét változó, de csak a Hardware_ECC_Recovered tükrözi az összes ECC-vel javitott (tehát hibásan is olvasott) esemény számot. Ez a másik csodás a S.M.A.R.T.-ban, a gyártók ízlésüknek megfelelő értéket tárolnak benne és szintén ők “találják ki”, hogy mi a hozzátartozó tűrésküszöb. Ami értelemszerűen akkorára van véve, hogy ne vigyék vissza minden második diszket a kedves végfelhasználók…

Szóval, ha viszont az ECC alapján sem sikerült a tartalmat visszaállítanunk, akkor bizony a hagyományos értelemben vett “bad sectorral” van dolgunk, ugyanis egyébként lehet, hogy jó lenne a szektor, ha újraírnánk, de ez kevéssé vígasztal minket, ha pont azon a szektoron fontos adatunk van, netán valami kriptográfiai fájlrendszerünk kulcsának egy része helyezkedik el rajta…

Ez S.M.A.R.T. ügyileg a – pirossal kiemelt – 197-es Current_Pending_Sector tartalmát fogja növelni.
A probléma itt kezdődik – leszámítva persze az egész új HDD technológia/S.M.A.R.T. kombót…

Device Model:     Hitachi HDT725050VLA360
Serial Number:    VFK401R41TPL8K
Firmware Version: V56OA7EA
User Capacity:    500.107.862.016 bytes

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   093   093   016    Pre-fail  Always       –       1572878
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      –       0
  3 Spin_Up_Time            0x0007   121   121   024    Pre-fail  Always       –       486 (Average 340)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       –       10
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       –       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       –       0
  8 Seek_Time_Performance   0x0005   100   100   020    Pre-fail  Offline      –       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       –       1548
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       –       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       –       10
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       –       74
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       –       74
194 Temperature_Celsius     0x0002   109   109   000    Old_age   Always       –       55 (Lifetime Min/Max 20/60)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       –       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       –       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      –       0
199 UDMA_CRC_Error_Count    0x000a   200   253   000    Old_age   Always       –       0

Model Family:     SAMSUNG SpinPoint P80 SD series
Device Model:     SAMSUNG HD120IJ
Serial Number:    S0AEJ1ML200047
Firmware Version: ZL100-33
User Capacity:    120.034.123.776 bytes

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   100   051    Pre-fail  Always       –       36
  3 Spin_Up_Time            0x0007   100   100   025    Pre-fail  Always       –       6336
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       –       27
  5 Reallocated_Sector_Ct   0x0033   253   253   010    Pre-fail  Always       –       0
  7 Seek_Error_Rate         0x000f   253   253   051    Pre-fail  Always       –       0
  8 Seek_Time_Performance   0x0025   253   253   015    Pre-fail  Offline      –       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       –       1903
 10 Spin_Retry_Count        0x0033   253   253   051    Pre-fail  Always       –       0
 11 Calibration_Retry_Count 0x0012   253   002   000    Old_age   Always       –       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       –       27
190 Temperature_Celsius     0x0022   094   088   000    Old_age   Always       –       48
194 Temperature_Celsius     0x0022   094   088   000    Old_age   Always       –       48
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       –       152375033
196 Reallocated_Event_Count 0x0032   253   253   000    Old_age   Always       –       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       –       1
198 Offline_Uncorrectable   0x0030   253   253   000    Old_age   Offline      –       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       –       0
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       –       0
201 Soft_Read_Error_Rate    0x000a   100   100   000    Old_age   Always       –       2
202 TA_Increase_Count       0x0032   253   253   000    Old_age   Always       –       0

Bocs a szétesett táblákért, a WordPress is egy kalap szamóca, de persze lehet, hogy én nem értek hozzá… (Ehhez sem…)

2 Responses to “Okosabb vagy-e mint a S.M.A.R.T. ?”

  1. maques says:

    Jogos, javítva…
    Ez a sok betű az abc-ben mindig összezavar… :-]

Leave a Reply