Hard Disk Sentinel: S.M.A.R.T., okosan

S.M.A.R.T.: buta korlátok

Az általánosan elterjedt S.M.A.R.T. működésével kapcsolatban sajnos valóban számos probléma merül fel. Ezek egy része (vagy összessége) miatt valóban nem minden esetben működik a merevlemez meghibásodásának előrejelzése. Ezen problémák lehetnek:

1. Nem megfelelő küszöbszintek

A S.M.A.R.T.-tal kapcsolatos problémák (azaz a nem megfelelő hiba-előrejelzés) nagy többségét az okozza, hogy a küszöbszintek nincsenek megfelelően, gondosan kiválasztva. Ennek következménye, hogy a merevlemeznek bizonyos attribútumoknál egyszerűen nincs esélye elérni a küszöböt, annál jóval előbb meghibásodik.

A gyakorlati életben több ízben találkozhatunk irreális küszöbszintekkel. Például a hibás szektorok maximális számát több ezerben (a tartalék adatterület nagyságának függvényében) határozzák meg. Így ennyit el kell érni, mire a S.M.A.R.T. jelezné, hogy meghibásodás várható. Önmagában ez nem jelent túl nagy adatterületet, hiszen például 1000 szektor is „csak” 512 000 bájt hibás területet jelentene (és nem jár kapacitásvesztéssel, mivel a tartalék terület át tudja venni a hibás szektorok szerepét), de nem mindegy ezen hibás szektorok eloszlása, mennyiségük növekedésének üteme.

Legtöbb esetben a problémák már jóval azelőtt jelentkeznek, hogy ezt a küszöböt megközelítené a kérdéses attribútum. Például egy fejhiba, mely miatt több ezer szektor válik használhatatlanná, már az adatterület jóval nagyobb hányadát is menthetetlenül tönkreteszi, és így a későbbi helyreállítást is megakadályozza. Nem beszélve arról, hogy egy-egy újabb problémás terület analizálása és onnan az adatok mentése a meghajtó számára akár órákig is tarthat (ha egyáltalán tökéletesen sikerül). Ilyen esetben a rendszer általában megáll, tehát egy folyamatosan romló, újabb és újabb hibákat produkáló merevlemez a teljes rendszer stabilitását is veszélyeztetheti.


Érték=253, küszöb=63; ennek eléréséhez nagyjából 1900 darab hibás szektorra
van szükség ezen a merevlemezen, itt szerencsére nincs egy sem [+]

De említhetjük például a teljesen rosszul megválasztott küszöbértéket is. Bizonyos gyártók a merevlemez teljes élettartamára mintegy 60–70 évet vagy még többet jelölnek meg, ha a megfelelő attribútum értékét kiolvassuk. Ez különösen érdekes annak a tudatában, hogy a gyártók általában 5 évre tervezik a termékeik élettartamát. Csak hab a tortán, hogy ha az élettartam lejár, a S.M.A.R.T. nem figyelmeztet, mivel ez az attribútum általában nem számít kritikusnak.


Az érték 759 nap használat alatt ment le 100-ról 97-re. Vajon hány nap kell,
mire a lemez a eléri a gyártó szerinti élettartam végét? [+]

Továbbá bizonyos kritikus attribútumok esetén a küszöb értéke 0. Könnyen belátható, hogy 0 alá nem csökkenhet az érték mező tartalma, ezért ezek az attribútumok akárhogyan is mérik és „szeretnék” előrejelezni a közelgő katasztrófát, a S.M.A.R.T. soha nem fog szólni.


Kritikus attribútumok 0 küszöbszinttel [+]

Néha az igazán fontos attribútumok nincsenek megjelölve mint „kritikus” attribútumok. Ennek következtében a merevlemez-ellenőrző alkalmazások és a BIOS-ban található S.M.A.R.T. funkció nem ellenőrzik ezen értékeket és a bekövetkező változásokat.

2. Hibás értékelési módszer

A merevlemez-ellenőrző programok túlnyomó többsége a fenti gyártóspecifikus módszert használja a merevlemez állapotának kijelzésére. Ilyen esetekben a legtöbb meghajtó jelentősen előnyösebbnek tűnik a valós állapotnál. Bizonyos gyártók az értékek állításával jobbnak próbálják beállítani a meghajtót, mint amilyen valójában – és ez sajnos több programot, felhasználót megtéveszt. Az sem ritka, hogy a gyártók a konkurencia termékénél szeretnék a merevlemezeiket jobbnak láttatni az értékek megválasztásával.

A szoftverek készítői pedig „mossák kezeiket”, hiszen ők a gyártóspecifikus értékeket használják, azaz ha a merevlemez idő előtt elhalálozna, rákenik a gyártóra. Mindeközben az ilyen szoftverek nem ritkán mutatnak várható élettartamnak (egy nem tökéletes merevlemez esetén is) 10–20 évet vagy még többet, ami minimum megkérdőjelezendő.

3. Attribútumok súlyossága

Könnyen belátható, hogy az egyes attribútumok más-más módon befolyásolják a merevlemez állapotát. Vannak viszont igazán kritikus paraméterek, például a 10-es (felpörgési újrapróbálkozások száma). Ennek apró változása is komoly problémára adhat okot (mely adódhat táp gyengeségből is, de a motor- vagy csapágyhiba sem kizárt).

A gyártók ilyenkor általában a küszöböt magasabbra teszik, azaz az attribútum elvileg hamarabb eléri azt, jelezve a problémát. Viszont a küszöb és a kiértékelő függvény megválasztása úgy történik, hogy néhány probléma még ezeknél a kritikus attribútumoknál is „belefér”, azaz nincs jelzés a felhasználó felé, hogy itt valami történt.

Problémát jelent továbbá, hogy az egyes attribútumok közötti összefüggés sem látszik, azaz könnyen lehet, hogy már több attribútum szerint is „majdnem” halálán van a merevlemez, de előrejelzés még sincs, hiszen egyik sem érte el a küszöbszintet.

4. Visszajelzés hiánya

Megfelelő, S.M.A.R.T.-ot kiolvasni képes szoftver használata nélkül a felhasználó általában semmit nem vesz észre a merevlemez állapotának romlásából – csak mikor már túl késő. Ha időnként néhány újabb hibás szektor keletkezik, és a lemez megpróbálja azokat tesztelni és az adatokat áthelyezni, nem biztos, hogy észrevehető (ha a gép nem dolgozik amúgy intenzíven). Ilyen esetekben az operációs rendszer általában teljesen megáll, ezért a felhasználók egy része – tévesen – ilyenkor újraindítja, esetleg lekapcsolja a számítógépet, mondván, az „kifagyott”. Az adatok helyreállítása közben eltűnő táp nem a legszebb módja annak, hogy kifejezzük, mennyire szeretjük merevlemezünket.

5. Hőmérséklet, érzékelőproblémák

Szoftver használata nélkül nem értesülünk továbbá a hőmérséklet alakulásáról sem. Míg a processzor, videokártya rendelkezik védelmi mechanizmussal (vészleállítás), a merevlemez nem. Ez különösen annak fényében érdekes, hogy a számítógép valamennyi alkatrésze közül a merevlemez a legérzékenyebb a magas hőmérsékletre. Néhány kivételtől eltekintve a gyártók 50–55 Celsius fokban maximálják az üzemi hőmérsékletet.

Míg a legtöbb BIOS lehetőséget biztosít a processzor hőmérsékletének, tápfeszültségnek, ventilátor-fordulatszámának ellenőrzésére, a merevlemezek hőmérsékletének felügyeletére nincs mód. Az alaplapi (BIOS) S.M.A.R.T. ellenőrzés a magas hőmérséklet esetén sem figyelmeztet. Így elképzelhető, hogy egy félig megfőtt merevlemezt használunk – amíg az bírja.

Fontos tudni, hogy a merevlemezbe épített hőmérsékletérzékelők egy része nem teljesen pontos (nem ritka a 8–10 fokos eltérés sem a valós hőmérséklethez képest), ezért érdemes a merevlemez hőmérsékletét más eszközzel (például infrás hőmérő segítségével) is megmérni, majd az erre alkalmas szoftverben beállítani a különbséget a valós és jelzett hőmérséklet között (kalibráció). Így a szoftver a későbbiekben a valós hőmérsékletet jelzi, felhasználva a kalibráció során megadott hőmérsékletkülönbséget. Érdemes megvizsgálni a merevlemez nyugalmi és huzamosabb ideig tartó teljes terhelés alatt mért hőmérsékletét is, komoly különbségek lehetnek a mért értékek között.


Ha bekapcsoláskor a hőmérséklet túl alacsony vagy túl magas
a környezethez képest, érdemes ellenőrizni a szenzor pontosságát

6. Nem megfelelő meghajtóprogramok

Sajnos nagyon sok hibás meghajtóprogrammal lehet találkozni, melyek által a vezérlőre (alaplapra) kötött merevlemezek egyikéről-másikáról nem lehet S.M.A.R.T. adatokat kiolvasni. A jelenség általában független a használt szoftvertől, mivel a merevlemezhez való hozzáférés hasonló elven alapul. Az sem ritka, hogy két merevlemez esetén mindkettőről ugyanazokat a működési értékeket szolgáltatja a vezérlő (általában az első lemez vagy primary master adatait). A szoftverek egy része ezt kiszűri, de gyanú esetén érdemes megbizonyosodni erről: ha a lemezek sorozatszáma, S.M.A.R.T. adatai feltűnően azonosnak tűnnek, akkor ott ilyen helyzet áll fenn.

Általánosan a meghajtóprogramok a merevlemezparancsok egy részét támogatják csak. Emiatt bizonyos funkciók nem minden esetben működnek (pl. akusztika menedzsment), még ha a merevlemez támogatja is azt. Emiatt érdemes figyelni, hátha a gyártók közzétesznek frissebb firmware-t, illetve újabb drivercsomagot, mellyel a helyzet javulhat. Amennyiben a vezérlőhöz RAID-es és nem-RAID-es drivercsomag is telepíthető, fontos a megfelelő változat telepítése. Ellenkező esetben általában búcsút mondhatunk a vezérlőre kötött merevlemez részletes adatainak (hőmérséklet, egészségi állapot stb.). Windows Vista alatt a néhol még félkész meghajtóprogramok miatt szintén ütközhetünk nehézségekbe a S.M.A.R.T. kiolvasásakor, de remélhetőleg ez idővel javulni fog.

7. Nem megfelelő hardver vagy hibás adatok

Ez a probléma szorosan kapcsolódik az előzőhöz. Bizonyos vezérlők, alaplapok használata esetén a S.M.A.R.T. küszöbök értéke nem kérdezhető le, vagy mindegyik küszöb 0. Az ilyen vezérlőre kötött merevlemezek sosem fognak hibát előrejelezni, hiszen egyik érték sem csökkenhet ez alá a szint alá. Az egyes szoftverek is tévesen kitűnőnek értékelhetik a merevlemezt, mivel az attribútumok értékei nagyon távol esnek a küszöbszinttől.


Minden küszöb 0 – az „örökké” fiatal és egészséges merevlemez. Vagy mégsem? [+]

Nem ritka az sem, hogy a visszaadott adatok hiányosak. Ez ugyan nem befolyásolja közvetlenül a lemez állapotát, de ilyenkor bizonyos kijelzett adatok (például az aktuális működési sebesség, Serial ATA működési tulajdonságok stb.) hitelessége megkérdőjelezhető – szerencsére ez nem befolyásolja a hőmérséklettel és az egészségi állapottal összefüggő információk lekérdezését. Az újabb szoftverek figyelmezetetnek ennek lehetőségére, az ATA ellenőrző szó kiolvasásával.


Ideális esetben a driver minden adatot pontosan ad vissza

Hibás szektorok?

Többször előforduló kérdés, hogy mit jelentenek a „hibás szektorok”, hogyan lehet ezeket orvosolni. Sokan furcsának tartják ezt, hiszen a lemez felületét ellenőrző szoftverek (mint a Windows lemezellenőrző) nem jeleznek hibás területet, akkor hogy is van ez?

A merevlemezben található önellenőrző algoritmus a következőképpen működik: mikor a lemez felületén problémát (hibás szektort) észlel, elkezdi onnan az adatokat átmenteni a tartalék adatterületre. Ilyenkor az eredeti helyet megjelöli hibásnak és minden további (ide irányuló) írás és olvasás átirányításra kerül a tartalék területre.

A folyamat végén az eredeti, hibás terület szoftveres úton nem érhető el többé. Ezért (többszöri) formázás és újratelepítés után sem mutat a lemez hibát, mivel valójában a hibásnak minősített adatterület ilyenkor nem esik formázás (ellenőrzés) és használat alá. Emiatt például az említett alkalmazás (Scandisk) sem talált hibát a felületen, még alapos teszteléssel sem. Egyedül a hardveres biztonsági törlés funkció éri el ezt a területet is, mely törli az esetlegesen ott maradt információt is. A DOS-os formázás a mai modern merevlemezeknél (a S.M.A.R.T. tevékenysége miatt) gyakorlatilag sosem talál hibás szektort (illetve csak akkor, ha a tartalék terület már megtelt, de ez valóban ritka).

Az adatok átmentése nem minden esetben problémamentes (bár tény, hogy a lemezek sokat fejlődtek ilyen téren az elmúlt évek alatt). Legjobb esetben az átmentés gond nélkül lezajlik, de a rendszert ez rövidebb-hosszabb ideig megakaszthatja, veszélyeztetheti annak stabilitását. Ideális esetben a felhasználó nem vesz észre semmit a fenti procedúrából, csak mikor már a S.M.A.R.T. egyik pillanatról a másikra riaszt – ha ugyan megéri a lemez, hogy a valamely attribútum értéke (mondjuk a hibás szektorok száma) alapján elérje a küszöböt.

Mire jó akkor a S.M.A.R.T.?

Összefoglalva tehát: a merevlemezek eltérőek, eltérő az elhasználódási karakterisztikájuk, a S.M.A.R.T. sem egységes (még adott gyártón belül sem), és nem is vizsgálja az adatokat megfelelő összefüggésekben, ráadásul néha a gyártók is kozmetikázzák az adatokat. A helyzet nem túl rózsás.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

  • 750 GB-os nagymenők

    Négy gyártó 750 GB-os merevlemezeit teszteltük. Vajon a kapacitás növelése mellett más előnyökkel is jár a fejlesztés?

Előzmények

Hirdetés