A Merevlemezek S.M.A.R.T. Funkciója

Nemrégiben jelent meg egy cikk, mely alapján úgy gondolhatnánk, hogy a merevlemezek címben említett funkciója nem használható, illetve nem ad valós képet a lemez állapotáról. Ebben van némi igazság, de azért nem teljesen egyértelmű a helyzet. Miről is van itt szó? (Először a S.M.A.R.T. alapjait tekintjük át, gyakorlott felhasználók a következő néhány bekezdést átugorhatják).

S.M.A.R.T.

A S.M.A.R.T. (Self-Monitoring Analysis and Reporting Technology, azaz Ön-ellenőrző Analizáló és Nyilvántartó Technológia) az IBM fejlesztése. Létrehozásának célja a merevlemez állapotának folyamatos figyelése, különböző módszerekkel, eszközökkel. Egy merevlemezben maximálisan 30 különféle mért érték (attribútum) tárolására és aktualizásálásra van lehetőség, melyek egy része közvetve vagy közvetlenül meghatározza a lemez egészségi állapotát, míg más részük statisztikai információt hordoz.

Mára gyakorlatilag az összes IDE/Serial ATA/SCSI merevlemezbe beépítésre került, de nem vált teljesen szabványossá, így az egyes attribútumok jelentése gyártónként eltérő. Jelen cikkünkben az ATA (IDE és S-ATA) merevlemezek működésével foglalkozunk. A SCSI esetében picit más a helyzet, mivel ott szabványosak a tárolt adatok, sőt az egyes szenzorok (pl. hőérzékelő) maximális eltérése is fixen rögzített (+/- 3 Celsius fok).

Bizonyos paraméterek többé-kevésbé szabványossá váltak, így a merevlemezek jelentős részén lehetséges az egyes problémákon túl például a működési hőmérséklet és a bekapcsolva töltött idő kiolvasása is. Az újabb szoftverek képesek ezeket az adatokat kiolvasni és megfelelő feldolgozás után kijelezni.

A S.M.A.R.T. specifikációja szerint probléma észlelésétől és jelentésétől még 24 órát kell a merevlemeznek működnie, amíg az adatok mentése folyik. A legtöbb esetben ez nagyon kevés - éppen ezért fontos a korábbi felismerés, megelőzés.

Tekintse meg a S.M.A.R.T. attribútumok teljes listáját és azok jelentését! (pl. reallocated sector count, off-line uncorrectable sectors count, stb.)

A S.M.A.R.T. működése

A merevlemezen belül a pillanatnyi állapotot több szenzor, értékelő algoritmus folyamatosan méri és a megfelelő attribútumokat ennek megfelelően módosítja.

Az egyes működési attribútumok több részből állnak:

  • Azonosító (bájt): némely értékek de facto szabványossá váltak (pl. 5 = tartalék területre áthelyezett szektorok száma, 194 = hőmérséklet, stb.) A szoftverek nagy része az egyes azonosítókhoz megfelelő nevet, vagy akár leírást is ad.

  • Adat (6 bájt): a szenzorok által szolgáltatott mérések eredménye illetve a mérés és egy korábbi állapot alapján meghatározott adat, vagy számláló jellegű attribútum esetén problémák összes száma (halmozottan) kerül itt rögzítésre. Az egyes gyártók által meghatározott, típusonként eltérő módszer alapján ez az adat valamilyen formában további feldolgozásra kerül. Nem ritka, hogy az Adat mező bizonyos részei (pl. alsó-felső-középső 16 bit) más-más jellegű számadatot tartalmaznak azonos attribútumon belül.

  • Küszöb (bájt): az attribútumhoz tartozó (meghibásodási) küszöb értékét tartalmazza.

  • Érték (bájt): a jelenlegi állapotot meghatározó érték, az "Adat" mező feldolgozása alapján kerül meghatározásra, a kérdéses attribútum relatív "jóságát" mutatja. A merevlemez első használatakor egy elméleti maximum értéken (általában 100, 200 vagy 253) áll, melyről a használat során folyamatosan alacsonyabb szintre kerül.

  • Legrosszabb (bájt): a valaha mért legrosszabb (legalacsonyabb) értéket tárolja.

  • Állapotjelzők: megmutatják, hogy az adott attribútum milyen célt szolgál. Például statisztikai (hőmérséklet) ill. kritikus attribútum, esemény számláló (áthelyezett szektorok száma) stb.

Megjegyzés: a szoftverek egy része ezek adatok alapján mást is kijelezhet (pl. attribútum állapota) és az adatok értékelésében, menedzselésében is segítséget nyújthat.

Attribútumok a megfelelő adatokkal
Attribútumok a megfelelő adatokkal

Valamely attribútum akkor hibátlan, ha az érték mező nagyobb vagy egyenlő, mint a küszöb mező. Ha ez nem teljesül valamely kritikus attribútumra, akkor a merevlemez hibásnak minősül, ilyenkor azonnali cserére szorul. A valódi hiba okára a kérdéses attribútum enged következtetni. Garanciális merevlemezt a gyártó ebben az esetben cseréli a garancia feltételeinek megfelelően. Az egyes alaplapok által támogatott S.M.A.R.T. funkció is riaszt az operációs rendszer betöltődése előtt. Ha a küszöb=0, akkor az attribútum nem képes problémát előrejelezni (hiszen az érték nem mehet 0 alá).

Matematikai kifejezéssel tehát az egyes attribútumok hibátlansága akkor teljesül, ha az alábbi egyenlőtlenség IGAZ (humán beállítottságú olvasók lépjenek a következő bekezdésre):

A - f(ny) >= C     (1)

Ahol:

  • A - elméleti maximális érték, az attribútum "legjobb" értéke.

  • f - egy leképező függvény, mely a nyers értékek alapján kiszámított eredménnyel csökkenti a kezdeti értéket. Általában lineáris függvény, azaz ny értéke egyszerűen szorzásra kerül egy B konstanssal.

  • C - a meghatározott küszöb értéke, mely alatt az attribútum értéke hibásnak minősül.

A módszer problémáit az jelenti, hogy nincsenek az A, B (ill. f függvény) és C értékek egyértelműen meghatározva (még azonos gyártó különböző típusain belül is eltérőek), valamint az, hogy az egyes paraméterek egymástól függetlenül kerülnek kiértékelésre.

A problémák

Az általánosan elterjedt S.M.A.R.T. működésével kapcsolatban sajnos valóban számos probléma merül fel. Ezek egy része (vagy összessége) miatt valóban nem minden esetben működött a merevlemez meghibásodásának előrejelzése. Ezen problémák lehetnek:

#1. Nem megfelelő küszöbszintek

A S.M.A.R.T.-tal kapcsolatos problémák (azaz a nem megfelelő hiba-előrejelzést) nagy többségét az okozza, hogy a küszöb szintek nincsenek megfelelően, gondosan kiválasztva. Ennek következménye, hogy a merevlemeznek bizonyos attribútumoknál egyszerűen nincs esélye elérni a küszöböt, annál jóval előbb meghibásodik. Ez esetben a S.M.A.R.T. valóban nem jelez problémát.

A gyakorlati életben több ízben találkozhatunk irreális küszöb szintekkel. Például a hibás szektorok maximális számát több ezerben (a tartalék adatterület nagyságának függvéynében) határozzák meg. Így ennyit el kell érni, mire a S.M.A.R.T. jelezné, hogy meghibásodás várható. Önmagában ez nem jelent túl nagy adatterületet, hiszen pl. 1000 szektor is "csak" 512000 bájt hibás területet jelentene (és nem jár kapacitás vesztéssel, mivel a tartalék terület át tudja venni a hibás szektorok szerepét), de nem mindegy ezen hibás szektorok eloszlása, mennyiségük növekedésének üteme.

Legtöbb esetben problémák már jóval azelőtt jelentkeznek, hogy ezt a küszöböt megközelítené a kérdéses attribútum. Például egy fejhiba, mely miatt több ezer szektor válik használhatatlanná, már az adatterület jóval nagyobb hányadát is menthetetlenül tönkreteszi, és így a későbbi helyreállítást is megakadályozza. Nem beszélve arról, hogy egy-egy újabb problémás terület analizálása és onnan az adatok mentése a meghajtó számára akár órákig is tarthat (ha egyáltalán tökéletesen sikerül). Ilyen esetben a rendszer általában megáll, tehát egy folyamatosan romló, újabb és újabb hibákat produkáló merevlemez a teljes rendszer stabilitását is veszélyeztetheti.

Érték=253, Küszöb=63, ennek eléréséhez nagyjából 1900 db hibás szektorra van szükség ezen a merevlemezen, itt szerencsére nincs egy sem
Érték=253, Küszöb=63, ennek eléréséhez nagyjából 1900 db hibás szektorra van szükség ezen a merevlemezen, itt szerencsére nincs egy sem

De említhetjük például a teljesen rosszul megválasztott küszöbértéket is. Például bizonyos gyártók a merevlemez teljes élettartamára mintegy 60-70 évet vagy még többet jelölnek meg, ha a megfelelő attribútum értékét kiolvassuk. Ez különösen érdekes annak a tudatában, hogy a gyártók általában 5 évre tervezik a termékeik élettartamát. Csak hab a tortán, hogy ha az élettartam lejár, a S.M.A.R.T. nem figyelmeztet, mivel ez az attribútum általában nem számít kritikusnak!

Az érték 759 nap használat alatt ment le 100-ról 97-re
Az érték 759 nap használat alatt ment le 100-ról 97-re, vajon hány nap kell, mire a lemez a eléri a gyártó szerinti élettartam végét?

Továbbá bizonyos kritikus attribútumok esetén a küszöb értéke 0. A fent említett egyenlőtlenségben szereplő számok (bájtok) alapján könnyen belátható, hogy 0 alá nem csökkenhet az érték mező tartalma. Íly módon ezek az attribútumok akárhogyan is mérik és "szeretnék" előrejelezni a közelgő katasztrófát, a S.M.A.R.T. soha nem fog szólni.

Kritikus attribútumok, 0 küszöbszinttel
Kritikus attribútumok, 0 küszöbszinttel

Néha az igazán fontos attribútumok nincsenek megjelelölve, mint "kritikus" attribútumok. Ennek következtében a merevlemez ellenőrző alkalmazások és a BIOS-ban található S.M.A.R.T. funkció nem ellenőrzik ezen értékeket és a bekövetkező változásokat.

#2. Hibás értékelési módszer

A merevlemez ellenőrző programok túlnyomó többsége a fenti gyártó specifikus módszert használja a merevlemez állapotának kijelzésére. Ilyen esetekben a legtöbb meghajtó jelentősen előnyösebbnek tűnik a valós állapotnál. Bizonyos gyártók az értékek állításával jobbnak próbálják beállítani a meghajtót mint amilyen valójában - és ez sajnos több programot, felhasználót megtéveszt. Az sem ritka, hogy a gyártók a konkurrencia termékénél szeretnék a merevlemezeiket jobbnak beállítani az értékek megválasztásával.

A szoftverek készítői pedig "mossák kezeiket", hiszen ők a gyártó-specifikus értékeket használják, azaz ha a merevlemez idő előtt elhalálozna, rákenik a gyártóra. Mindeközben az ilyen szoftverek nem ritkán mutatnak várható élettartamnak (egy nem tökéletes merevlemez esetén is) 10-20 évet vagy még többet, ami minimum megkérdőjelezendő.

#3. Attribútumok súlyossága

Könnyen belátható, hogy az egyes attribútumok más-más módon befolyásolják a merevlemez állapotát. Vannak viszont igazán kritikus paraméterek, például a 10-es (felpörgési újrapróbálkozások száma). Ennek apró változása is komoly problémára adhat okot (mely adódhat táp gyengeségből is, de a motor- vagy csapágyhiba sem kizárt).

A gyártók ilyenkor általában a küszöböt magasabbra teszik, azaz az attribútum elvileg hamarabb eléri azt, jelezve a problémát. Viszont a küszöb és a fenti (1) képletben található f függvény megválasztása úgy történik, hogy néhány probléma még ezeknél a kritikus attribútumoknál is "belefér", azaz nincs jelzés a felhasználó felé, hogy itt valami történt.

Problémát jelent továbbá, hogy az egyes attribútumok közötti összefüggés sem látszik, azaz könnyen lehet, hogy már több attribútum szerint is "majdnem" halálán van a merevlemez, de előrejelzés mégsincs, hiszen egyik sem érte el a küszöbszintet.

#4. Visszajelzés hiánya

Megfelelő S.M.A.R.T.-ot kiolvasni képes szoftver használata nélkül a felhasználó általában semmit nem vesz észre a merevlemez állapotának romlásából (csak mikor már túl késő). Ha időnként néhány újabb hibás szektor keletkezik és a lemez megpróbálja azokat tesztelni és az adatokat áthelyezni, nem biztos, hogy észrevehető (ha pl. a gép nem dolgozik amúgy intenzíven). Ilyen esetekben az operációs rendszer általában teljesen megáll, ezért a felhasználók egy része (tévesen) ilyenkor újraindítja, esetleg lekapcsolja a számítógépet, mondván az "kifagyott". Az adatok helyreállítása közben eltűnő táp nem a legszebb módja annak, hogy kifejezzük mennyire szeretjük merevlemezünket.

#5. Hőmérséklet, érzékelő problémák

Szoftver használata nélkül nem értesülünk továbbá a hőmérséklet alakulásáról sem. Míg a processzor, videókártya rendelkezik védelmi mechanizmussal (vészleállítás) a merevlemez nem. Ez különösen annak fényében érdekes, hogy a számítógép valamennyi alkatrésze közül a merevlemez a legérzékenyebb a magas hőmérsékletre. Néhány kivételtől eltekintve a gyártók 50-55 Celsius fokban maximálják az üzemi hőmérsékletet.

Míg a legtöbb BIOS lehetőséget biztosít a processzor hőmérsékletének, tápfeszültségnek, ventillátor fordulatszámának ellenőrzésére, a merevlemezek hőmérsékletének felügyeletére nincs mód. Az alaplapi (BIOS) S.M.A.R.T. ellenőrzés a magas hőmérséklet esetén sem figyelmeztet. Így elképzelhető, hogy egy félig megfőtt merevlemezt használunk - amíg az bírja.

Fontos tudni, hogy a merevlemezbe épített hőmérséklet érzékelők egy része nem teljesen pontos (nem ritka a 8-10 fokos eltérés sem a valós hőmérséklethez képest), ezért érdemes a merevlemez hőmérsékletét más eszközzel (pl. infrás hőmérő segítségével) is megmérni, majd az erre alkalmas szoftverben beállítani a különbséget a valós és jelzett hőmérséklet között (kalibráció). Így a szoftver a későbbiekben a valós hőmérsékletet jelzi, felhasználva a kalibráció során megadott hőmérséklet különbséget.

Érdemes megvizsgálni a merevlemez nyugalmi és huzamosabb ideig tartó teljes terhelés alatt mért hőmérsékletet is, komoly különbségek lehetnek a mért hőmérséklet értékek között.

Ha bekapcsoláskor a hőmérséklet túl alacsony vagy túl magas a környezethez képest, érdemes ellenőrizni a szenzor pontosságát
Ha bekapcsoláskor a hőmérséklet túl alacsony vagy túl magas a környezethez képest, érdemes ellenőrizni a szenzor pontosságát

#6. Nem megfelelő meghajtóprogramok (driver-ek)

Sajnos nagyon sok hibás meghajtóprogrammal lehet találkozni, melyek által a vezérlőre (alaplapra) kötött merevlemezek egyikéről-másikáról nem lehet S.M.A.R.T. adatokat kiolvasni. A jelenség általában független a használt szoftvertől, mivel a merevlemezhez való hozzáférés hasonló elven alapul. Az sem ritka, hogy két merevlemez esetén mindkettőről ugyanazokat a működési értékeket szolgáltatja a vezérlő (általában az első lemez vagy PRIMARY MASTER adatait). A szoftverek egy része ezt kiszűri, de gyanú esetén érdemes megbizonyosodni erről: ha a lemezek sorozatszáma, S.M.A.R.T. adatai feltűnően azonosnak tűnnek, akkor ott ilyen helyzet áll fenn.

Általánosan a meghajtóprogramok a merevlemez parancsok egy részét támogatják csak. Emiatt bizonyos funkciók nem minden esetben működnek (pl. akusztika menedzsment) még ha a merevlemez támogatja is azt.

Emiatt érdemes figyelni, hátha a gyártók közzétesznek frissebb firmware-t illetve újabb driver csomagot, mellyel a helyzet javulhat. Amennyiben a vezérlőhöz RAID-es és nem-RAID-es driver csomag is telepíthető, fontos a megfelelő (nem-RAID-es) változat telepítése (már ha nem használunk RAID-et). Ellenkező esetben általában búcsút mondhatunk a vezérlőre kötött merevlemez részletes adatainak (hőmérséklet, egészségi állapot, stb.)

Számos alaplap illetve merevlemez vezérlő nem rendelkezik minden szempontból tökéletes meghajtóprogrammal Vista alá. Ez megnehezíti illetve lehetetlenné teheti az új operációs rendszer alatt a lemez információinak lekérését és a problémák előrejelzését.

#7. Nem megfelelő hardver vagy hibás adatok

Ez a probléma szorosan kapcsolódik az előzőhöz. Bizonyos vezérlők, alaplapok használata esetén a S.M.A.R.T. küszöbök értéke nem kérdezhető le vagy mindegyik küszöb 0. Az ilyen vezérlőre kötött merevlemezek sosem fognak hibát előrejelezni, hiszen egyik érték sem csökkenhet ez alá a szint alá. Az egyes szoftverek is tévesen kitűnőnek értékelhetik a merevlemezt, mivel az attribútumok értékei nagyon távol esnek a küszöbszinttől.

Minden küszöb 0
Minden küszöb 0 - az "örökké" fiatal és egészséges merevlemez. Vagy mégsem?

Nem ritka az sem, hogy a visszaadott adatok hiányosak. Ez ugyan nem befolyásolja közvetlenül a lemez állapotát, de ilyenkor bizonyos kijelzett adatok (például az aktuális működési sebesség, Serial-ATA működési tulajdonságok, stb.) hitelessége megkérdőjelezhető (szerencsére ez nem befolyásolja a hőmérséklet és az egészségi állapottal összefüggő információk lekérdezését). Az újabb szoftverek figyelmezetetnek ennek lehetőségére, az ATA ellenőrző szó kiolvasásával (leírása megtalálható az "AT Attachment - 8 ATA/ATAPI Command Set (ATA8-ACS)" dokumentum 116. oldalán.

Ideális esetben a driver minden adatot pontosan ad vissza
Ideális esetben a driver minden adatot pontosan ad vissza

Hibás szektorok?

Többször előforduló kérdés, hogy mit jelentenek a "hibás szektorok", hogyan lehet ezeket orvosolni. Sokan furcsának tartják ezt, hiszen a lemez felületét ellenőrző szoftverek (pl. Windows lemezellenőrző) nem jeleznek hibás területet, akkor hogy is van ez?

A merevlemezben található önellenőrző algoritmus a következőképpen működik: mikor a lemez felületén problémát (hibás szektort) észlel, elkezdi onnan az adatokat átmenteni a tartalék adatterületre. Ilyenkor az eredeti helyet megjelöli hibásnak és minden további (ide irányuló) írás és olvasás átirányításra kerül a tartalék területre.

A folyamat végén az eredeti (hibás) terület szoftveres úton nem érhető el többé. Ezért (többszöri) formázás és újratelepítés után sem mutat a lemez hibát, mivel valójában a hibásnak minősített adatterület ilyenkor nem esik formázás (ellenőrzés) és használat alá. Emiatt például az említett alkalmazás (Scandisk) sem talált hibát a felületen, még alapos teszteléssel sem. Egyedül a hardveres biztonsági törlés funkció éri el ezt a területet is, mely törli az esetlegesen ott maradt információt is.

Emiatt pl. a DOS-os formázás a mai modern merevlemezeknél (a S.M.A.R.T. tevékenysége miatt) gyakorlatilag sosem talál hibás szektort (illetve csak akkor, ha a tartalék terület már megtelt, de ez valóban ritka, személy szerint még nem találkozam ilyen merevlemezzel).

Az adatok átmentése nem minden esetben problémamentes (bár tény, hogy a lemezek sokat fejlődtek ilyen téren az elmúlt évek alatt). Legjobb esetben az átmentés gond nélkül lezajlik, de a rendszert ez rövidebb-hosszabb ideig megakaszthatja, veszélyeztetheti annak stabilitását.

Ideális esetben a felhasználó nem vesz észre semmit a fenti procedúrából, csak mikor már a S.M.A.R.T. egyik pillanatról a másikra riaszt - ha megéri a lemez, hogy a valamely attribútum értéke (pl. a hibás szektorok száma alapján) elérje a küszöböt.

Megoldás

Az valóban elég ritka, hogy minden különösebb ok nélkül egy merevlemez elhalálozzon, kivéve a leesést, túlfeszültséget, természeti katasztrófát, melyeket értelemszerűen nem jelez előre a S.M.A.R.T. (sem). Általában néhány hibás szektor megjelenik, ezek száma egyre nő, a lemez állapota lassan de folyamatosan romlik (akár hetek is elmúlhatnak "tünetmentesen"). Más esetben a magas hőmérséklet és/vagy kevés számú de nagyon kritikus hiba (pl. felpörgés sikertelensége) adhat okot aggodalomra.

Nem ritka az sem, hogy több különböző probléma jelentkezik, melyek együttes hatása más és más hibára enged következtetni. Például ha a merevlemez nehezen (csak többszöri újrapróbálkozás után) vagy lassan pörög fel (mely motor ill. csapágy hibára enged következtetni), annak nyoma van a S.M.A.R.T. adat mezőkben. De akár csak egyetlen újabb hibás vagy gyenge szektor is bejegyzésre kerül, tehát minden változás (még ha csekély mértékű is) észlelhető.

Fontos, hogy ezeket a jeleket időben felismerjük és jóval az adatvesztés előtt fel tudjunk lépni. Ezért lényeges, hogy a korábban használt modellt (és a fenti (1) képletet) teljesen mellőzve, a gyártó specifikus küszöbértékeket (vagy azok hiányát, rossz megválasztását) figyelmen kívül hagyva a nyers mért értékeket vegyük alapul, azok alapján alkossunk véleményt a merevlemezről, lehetőség szerint az egyes attribútumok közötti kölcsönhatást, összefüggést is vizsgálva. Így valós képet kaphatunk a lemez állapotáról, megtudhatjuk mi okoz problémát és esetleg mit tehetünk a védekezés, megelőzés érdekében.

Érdemes az értékelést a merevlemez használatának és az adatok fontosságának figyelembevételével megválasztani. Egy komolyabb használat alatt álló, nagyobb igénybevételű (pl. szerver vagy hordozható számítógép) illetve kritikus adatokat tartalmazó merevlemez esetén a legkisebb hiba is végzetes lehet, így fontos, hogy bármilyen apró botlás, hiba esetén azonnal lépni lehessen.

A szoftverek egy része képes ilyen módon (módokon) értékelni a merevlemez állapotát, valamint szöveges értékelést készíteni, esetleges tippeket adni a problémák orvoslására. Hasznos funkció, ha az esetleges új problémák észlelésekor a szoftver nem csak passzívan tud figyelmeztetni (például hangjelzéssel, üzenet küldésével, lekapcsolással), hanem aktívan is képes fellépni, például teljes vagy részleges adatmentési (archiválási) feladatok indításával.

A Hard Disk Sentinel alkalmazás kialakítása a fentiek figyelembevételével történt. A fejlesztés során a Králik és Társa Kft.-hez adatmentésre érkezett merevlemezek S.M.A.R.T. adatait elemezve készült el a lemezek értékelését végző modul, mely a szöveges értékeléssel együtt pontos képet ad a valóban előforduló problémákról. A fejlesztés során lehetőség volt megvizsgálni számos különböző gyártójú és típusú merevlemez állapotát - melyek már csak komoly adatmentő módszerek segítségével voltak működőképesek. Fontos megemlíteni, hogy ezen merevlemezek túlnyomó többségénél a "hagyományos" S.M.A.R.T. valóban nem jelzett meghibásodás előtt.

Példa

Az alábbi S.M.A.R.T. attribútumokkal rendelkező merevlemez működésképtelen állapotban került adatmentésre:

AzonosítóAttribútum névKüszöbÉrtékLegrosszabbAdatÁllapotjelzőkKritikus?
1 Raw Read Error Rate 50 100 100 000000000000 000BIgen
2 Throughput Performance 50 100 100 000000000000 0005 
3 Spin Up Time 1 100 100 0000000001E9 0027 
4 Start/Stop Count 0 100 100 000000000A5A 0032 
5 Reallocated Sectors Count 50 100 100 000000000015 0033Igen
7 Seek Error Rate 50 100 100 000000000000 000BIgen
8 Seek Time Performance 50 100 100 000000000000 0005 
9 Power-On Time Count 0 87 87 0000000014C1 0032 
10 Spin Retry Count 30 152 100 000000000000 0033Igen
12 Drive Power Cycle Count 0 100 100 0000000009EA 0032 
192 Vendor-specific 0 100 100 000000000058 0032 
193 Load/Unload Cycle Count 0 73 73 00000004218D 0032 
194 HDD Temperature 0 100 100 003B00020024 0022 
196 Reallocation Event Count 0 100 100 00000000000F 0032 
197 Current Pending Sector Count 0 100 100 000000000004 0032 
198 Off-Line Uncorrectable Sector Count 0 100 100 000000000000 0030 
199 Ultra ATA CRC Error Count 0 200 200 000000000000 0032 
220 Disk Shift 0 100 100 0000000000B3 0002 
222 Loaded Hours 0 95 95 0000000007EA 0032 
223 Load/Unload Retry Count 0 100 100 000000000000 0032 
224 Load Friction 0 100 100 000000000000 0022 
226 Load-in Time 0 100 100 00000000017F 0026 
240 Head flying hours 1 100 100 000000000000 0001Igen

A BIOS által támogatott S.M.A.R.T. ellenőrzés problémát nem jelzett. A táblázatot áttanulmányozva látható, hogy az Érték oszlopban található számok (100 ill. a felettiek) a Küszöb értékektől nagyon távol állnak, sőt többségük (100-as értékek) el sem mozdult a maximális kondíciót jelző szintről. Emiatt a gyártó specifikus értékek elemzésével a merevlemez nemhogy hibásnak nem mutatja magát, de a kondíciója tökéletesnek tűnik. A 100-nál alacsonyabb értékek a merevlemez működési idejéből adódnak, mindazonáltal a lemez összesen csak 5313 órát (0x14C1) töltött bekapcsolva (jelen merevlemeznél a teljes működési időt a gyártó vélhetőleg jól adta meg, azt kiszámítva nagyjából 4,7 évet kapunk napi 24 órás üzemmódban használva: (5313/0,13)/24/365 = 4,665 év). Tehát elhasználódásról még szó sem lehet.

Ezzel szemben a Hard Disk Sentinel értékelő algoritmusa segítségével egészen más eredményt kapunk. Mivel a kérdéses merevlemez egy hordozható számítógépben használt 2.5"-os példány, a szigorúbb értékelési módszer segítségével kerül értékelésre a merevlemez állapota. Az értékelésben részt vesznek azon attribútumok is, melyek funkciójuk szerint felelősek a lemez valós állapotáért - még ha azok a gyártó szerint nem kritikusak.

A kondíció számítása (figyelembe véve az 5-ös, 196-os, 197-es attribútumok Adat mezőjében található értékeket):

100 x (100 - 10x6) x (100 - 30) x (100 - 4x4) = 23,52 %

Az értékelés alapján a merevlemez kondíciója igencsak aggasztó. A szoftver alaphelyzetben ilyen kondíció esetén már figyelmeztet, hogy adatvesztés várható. A megfelelő számítási módszer kiválasztásával és a megfelelő riasztási szint beállításával még akár ennél korábban is jelezhető lett volna az adatvesztés ennél a merevlemeznél - ha a megfelelő szoftver előzőleg telepítése kerül.

Önmagában ha a kondíció alacsony, nem jelenti azt, hogy a merevlemez biztosan meg fog hibásodni az elkövetkezendő időszakban (ehhez tüzetesebb - nem szoftveres - vizsgálatok szükségesek), de reális esély van rá. A fenti merevlemez problémája nehezen detektálható, valóban kevés nyomot hagy a S.M.A.R.T. táblázatban. Más probléma esetén más merevlemezek (akár ennél alacsonyabb kondíció értékkel is) nem kizárt, hogy hosszú ideig üzemelnek még (például rövid ideig tartó túl nagy hőmérséklet, nem megfelelő tápellátás által okozott problémák maguktól nem javulnak meg, de az ok elhárításával a merevlemez további élettartama meghosszabbítható). Mindazonáltal az ilyen lemezeket érdemesebb fokozottabb figyelemmel működtetni és gondoskodni róla, hogy a tárolt adatok egy másik, lehetőség szerint jobb állapotú eszközön is rendelkezésre álljanak.

Máthé János

Jelen írás (illetve annak bármely része) szabadon felhasználható, terjeszthető, de kizárólag az eredeti cikkre való hivatkozással (link) együtt.

Vissza a Hard Disk Sentinel oldalára

Felhasznált irodalom

Information technology - AT Attachment 8 - ATA/ATAPI Command Set (ATA8-ACS) (Revision 3f December 11, 2006)
www.t13.org, D1699r3f-ATA8-ACS.pdf

Tekintse meg a S.M.A.R.T. attribútumok teljes listáját és azok jelentését! (pl. reallocated sector count, off-line uncorrectable sectors count, stb.)

Oldal megjelenítések száma: 11153