Hard Disk Sentinel: S.M.A.R.T., okosan

S.M.A.R.T.: hasznos öndiagnosztika

A merevlemezes adattárolás veszélyei

Napjaink legáltalánosabb elsődleges adattároló eszköze a merevlemez. Minden számítógépben alapvető alkatrész, és egyre több más helyen is találkozunk vele: külső házakban, asztali és hordozható médialejátszókban, mobiltelefonokban, és természetesen minden notebookban is van legalább egy.

Mégis, mennyire megbízható egy merevlemez? Egy mai számítógépben hatalmas adatmennyiség gyűlik össze – a napi munkától kezdve a kedvenc játékunk aktuális mentésén át a családi fotókig és különféle multimédiás tartalmakig. Akár több évnyi tartalom halmozódhat fel egy gépben, köztük pótolhatatlanok is, és ez ma már nem csak vállalati felhasználásnál igaz: míg a munkához kapcsolódó adatok sérülése pénzben is kifejezhető veszteség, több évnyi családi fotó és videó elvesztése már nehezebben számszerűsíthető, mégis rendkívül kellemetlen és fájdalmas.

Hogyan védekezhetünk a merevlemezhibák ellen? Merthogy elkerülhetetlenül előfordulnak – aki saját maga még szerencsésen megúszta eddig, az is egészen biztosan hallott már rémtörténeteket másoktól. A merevlemezhiba – rosszabb esetben adatvesztés – pedig pont mindig a legrosszabbkor „csap le”. Mit lehet tenni? Szemrevételezéssel nem lehet merevlemezt diagnosztizálni – illetve amikor már fizikai elváltozás látszik, az már általában régen rossz.

Számos megoldás és taktika létezik az adatbiztonság fokozására, egyik sem túl kényelmes. A legjobb az lenne, ha a merevlemez előre szólna meghibásodás előtt, hogy mi időben, kényelmesen átmenthessük az adatainkat egy új adathordozóra. Ez lenne az igazi.

Ez a gondolat vezérelte az IBM mérnökeit is kilencvenes évek elején, amikor elkezdtek öndiagnosztikára is képes háttértárat készíteni. Ebből a fejlesztésből alakult ki pár évvel később a több gyártó által támogatott S.M.A.R.T. (Self-Monitoring Analysis and Reporting Technology, azaz önellenőrző, analizáló és nyilvántartó technológia). Létrehozásának célja a merevlemez állapotának folyamatos figyelése, különböző módszerekkel, eszközökkel: a különféle mért és tárolt értékek (attribútumok) kiértékeléséből következtethetünk merevlemezünk állapotára, így (elvileg) a meghibásodás is előre jelezhető. A valóság azonban nem ilyen egyszerű.

A merevlemez egy mechanikai eszköz – számos mozgó alkatrészt, valamint mágneses felületeket tartalmaz, amelyek idővel lassacskán elhasználódnak a legkörültekintőbb üzemeltetés mellett is. Hogy a fokozatos romlás mikor vezet adatvesztéshez, nem jelölhető meg pontosan, nem köthető néhány paraméter egy-egy konkrét értékéhez. Jelentősen eltérő állapotok is vezethetnek adatvesztéshez, leginkább azt lehet kijelenteni, hogy adott állapotok mellett mennyire valószínű az egység meghibásodása. A S.M.A.R.T. egy nagyon hasznos eszköz, azonban önmagában számos okból nem képes teljességgel ellátni az eredetileg megcélzott feladatát.

A S.M.A.R.T. működése

Mára gyakorlatilag az összes IDE/Serial ATA/SCSI merevlemezbe beépítették a S.M.A.R.T.-ot, de nem vált teljesen szabványossá, így az egyes attribútumok jelentése gyártónként eltérő. Jelen cikkünkben az ATA (IDE és SATA) merevlemezek működésével foglalkozunk. A SCSI esetében más a helyzet, mivel ott szabványosak a tárolt adatok, sőt az egyes szenzorok (például hőérzékelő) maximális eltérése is fixen rögzített (±3 °C).

Bizonyos paraméterek többé-kevésbé szabványossá váltak, így a merevlemezek jelentős részén lehetséges az egyes problémákon túl például a működési hőmérséklet és a bekapcsolva töltött idő kiolvasása is. A S.M.A.R.T. egyrészt feldolgozza az összegyűjtött adatokat, és meghatározott események esetén hibát jelez, másrészt az adatok külső szoftverek számára is elérhetőek további feldolgozás, elemzés végett.

A merevlemezen belül a pillanatnyi állapotot több szenzor, értékelő algoritmus folyamatosan méri, és az attribútumokat ennek megfelelően módosítja. Az egyes működési attribútumok több részből állnak, mindegyiknél tárolva van egy aktuálisan mért vagy számított adat, illetve egy ebből számított „jósági” érték, valamint egy előre definiált küszöb. Emellett az egyes attribútumok fajtája is kódolva van, például hogy az adott attribútum kritikus-e.


Attribútumok a megfelelő adatokkal [+]

A S.M.A.R.T. saját helyzetértékelése meglehetősen egyszerű: egy attribútum akkor hibátlan, ha az érték mező nagyobb vagy egyenlő, mint a küszöb mező. Ha valamely kritikus attribútum a küszöb alá csökken, akkor a merevlemez hibásnak minősül, ilyenkor azonnali cserére szorul.

Itt rögtön látszik a S.M.A.R.T. egyik komoly korlátja: nem folyamatában jelzi a hiba kialakulását, a merevlemez állapotának folyamatos romlását, hanem csak egy általa meghatározott küszöbérték elérésekor riaszt. Sajnos azonban nem ez az egyetlen probléma a S.M.A.R.T. működésével.

S.M.A.R.T.: buta korlátok

Az általánosan elterjedt S.M.A.R.T. működésével kapcsolatban sajnos valóban számos probléma merül fel. Ezek egy része (vagy összessége) miatt valóban nem minden esetben működik a merevlemez meghibásodásának előrejelzése. Ezen problémák lehetnek:

1. Nem megfelelő küszöbszintek

A S.M.A.R.T.-tal kapcsolatos problémák (azaz a nem megfelelő hiba-előrejelzés) nagy többségét az okozza, hogy a küszöbszintek nincsenek megfelelően, gondosan kiválasztva. Ennek következménye, hogy a merevlemeznek bizonyos attribútumoknál egyszerűen nincs esélye elérni a küszöböt, annál jóval előbb meghibásodik.

A gyakorlati életben több ízben találkozhatunk irreális küszöbszintekkel. Például a hibás szektorok maximális számát több ezerben (a tartalék adatterület nagyságának függvényében) határozzák meg. Így ennyit el kell érni, mire a S.M.A.R.T. jelezné, hogy meghibásodás várható. Önmagában ez nem jelent túl nagy adatterületet, hiszen például 1000 szektor is „csak” 512 000 bájt hibás területet jelentene (és nem jár kapacitásvesztéssel, mivel a tartalék terület át tudja venni a hibás szektorok szerepét), de nem mindegy ezen hibás szektorok eloszlása, mennyiségük növekedésének üteme.

Legtöbb esetben a problémák már jóval azelőtt jelentkeznek, hogy ezt a küszöböt megközelítené a kérdéses attribútum. Például egy fejhiba, mely miatt több ezer szektor válik használhatatlanná, már az adatterület jóval nagyobb hányadát is menthetetlenül tönkreteszi, és így a későbbi helyreállítást is megakadályozza. Nem beszélve arról, hogy egy-egy újabb problémás terület analizálása és onnan az adatok mentése a meghajtó számára akár órákig is tarthat (ha egyáltalán tökéletesen sikerül). Ilyen esetben a rendszer általában megáll, tehát egy folyamatosan romló, újabb és újabb hibákat produkáló merevlemez a teljes rendszer stabilitását is veszélyeztetheti.


Érték=253, küszöb=63; ennek eléréséhez nagyjából 1900 darab hibás szektorra
van szükség ezen a merevlemezen, itt szerencsére nincs egy sem [+]

De említhetjük például a teljesen rosszul megválasztott küszöbértéket is. Bizonyos gyártók a merevlemez teljes élettartamára mintegy 60–70 évet vagy még többet jelölnek meg, ha a megfelelő attribútum értékét kiolvassuk. Ez különösen érdekes annak a tudatában, hogy a gyártók általában 5 évre tervezik a termékeik élettartamát. Csak hab a tortán, hogy ha az élettartam lejár, a S.M.A.R.T. nem figyelmeztet, mivel ez az attribútum általában nem számít kritikusnak.


Az érték 759 nap használat alatt ment le 100-ról 97-re. Vajon hány nap kell,
mire a lemez a eléri a gyártó szerinti élettartam végét? [+]

Továbbá bizonyos kritikus attribútumok esetén a küszöb értéke 0. Könnyen belátható, hogy 0 alá nem csökkenhet az érték mező tartalma, ezért ezek az attribútumok akárhogyan is mérik és „szeretnék” előrejelezni a közelgő katasztrófát, a S.M.A.R.T. soha nem fog szólni.


Kritikus attribútumok 0 küszöbszinttel [+]

Néha az igazán fontos attribútumok nincsenek megjelölve mint „kritikus” attribútumok. Ennek következtében a merevlemez-ellenőrző alkalmazások és a BIOS-ban található S.M.A.R.T. funkció nem ellenőrzik ezen értékeket és a bekövetkező változásokat.

2. Hibás értékelési módszer

A merevlemez-ellenőrző programok túlnyomó többsége a fenti gyártóspecifikus módszert használja a merevlemez állapotának kijelzésére. Ilyen esetekben a legtöbb meghajtó jelentősen előnyösebbnek tűnik a valós állapotnál. Bizonyos gyártók az értékek állításával jobbnak próbálják beállítani a meghajtót, mint amilyen valójában – és ez sajnos több programot, felhasználót megtéveszt. Az sem ritka, hogy a gyártók a konkurencia termékénél szeretnék a merevlemezeiket jobbnak láttatni az értékek megválasztásával.

A szoftverek készítői pedig „mossák kezeiket”, hiszen ők a gyártóspecifikus értékeket használják, azaz ha a merevlemez idő előtt elhalálozna, rákenik a gyártóra. Mindeközben az ilyen szoftverek nem ritkán mutatnak várható élettartamnak (egy nem tökéletes merevlemez esetén is) 10–20 évet vagy még többet, ami minimum megkérdőjelezendő.

3. Attribútumok súlyossága

Könnyen belátható, hogy az egyes attribútumok más-más módon befolyásolják a merevlemez állapotát. Vannak viszont igazán kritikus paraméterek, például a 10-es (felpörgési újrapróbálkozások száma). Ennek apró változása is komoly problémára adhat okot (mely adódhat táp gyengeségből is, de a motor- vagy csapágyhiba sem kizárt).

A gyártók ilyenkor általában a küszöböt magasabbra teszik, azaz az attribútum elvileg hamarabb eléri azt, jelezve a problémát. Viszont a küszöb és a kiértékelő függvény megválasztása úgy történik, hogy néhány probléma még ezeknél a kritikus attribútumoknál is „belefér”, azaz nincs jelzés a felhasználó felé, hogy itt valami történt.

Problémát jelent továbbá, hogy az egyes attribútumok közötti összefüggés sem látszik, azaz könnyen lehet, hogy már több attribútum szerint is „majdnem” halálán van a merevlemez, de előrejelzés még sincs, hiszen egyik sem érte el a küszöbszintet.

4. Visszajelzés hiánya

Megfelelő, S.M.A.R.T.-ot kiolvasni képes szoftver használata nélkül a felhasználó általában semmit nem vesz észre a merevlemez állapotának romlásából – csak mikor már túl késő. Ha időnként néhány újabb hibás szektor keletkezik, és a lemez megpróbálja azokat tesztelni és az adatokat áthelyezni, nem biztos, hogy észrevehető (ha a gép nem dolgozik amúgy intenzíven). Ilyen esetekben az operációs rendszer általában teljesen megáll, ezért a felhasználók egy része – tévesen – ilyenkor újraindítja, esetleg lekapcsolja a számítógépet, mondván, az „kifagyott”. Az adatok helyreállítása közben eltűnő táp nem a legszebb módja annak, hogy kifejezzük, mennyire szeretjük merevlemezünket.

5. Hőmérséklet, érzékelőproblémák

Szoftver használata nélkül nem értesülünk továbbá a hőmérséklet alakulásáról sem. Míg a processzor, videokártya rendelkezik védelmi mechanizmussal (vészleállítás), a merevlemez nem. Ez különösen annak fényében érdekes, hogy a számítógép valamennyi alkatrésze közül a merevlemez a legérzékenyebb a magas hőmérsékletre. Néhány kivételtől eltekintve a gyártók 50–55 Celsius fokban maximálják az üzemi hőmérsékletet.

Míg a legtöbb BIOS lehetőséget biztosít a processzor hőmérsékletének, tápfeszültségnek, ventilátor-fordulatszámának ellenőrzésére, a merevlemezek hőmérsékletének felügyeletére nincs mód. Az alaplapi (BIOS) S.M.A.R.T. ellenőrzés a magas hőmérséklet esetén sem figyelmeztet. Így elképzelhető, hogy egy félig megfőtt merevlemezt használunk – amíg az bírja.

Fontos tudni, hogy a merevlemezbe épített hőmérsékletérzékelők egy része nem teljesen pontos (nem ritka a 8–10 fokos eltérés sem a valós hőmérséklethez képest), ezért érdemes a merevlemez hőmérsékletét más eszközzel (például infrás hőmérő segítségével) is megmérni, majd az erre alkalmas szoftverben beállítani a különbséget a valós és jelzett hőmérséklet között (kalibráció). Így a szoftver a későbbiekben a valós hőmérsékletet jelzi, felhasználva a kalibráció során megadott hőmérsékletkülönbséget. Érdemes megvizsgálni a merevlemez nyugalmi és huzamosabb ideig tartó teljes terhelés alatt mért hőmérsékletét is, komoly különbségek lehetnek a mért értékek között.


Ha bekapcsoláskor a hőmérséklet túl alacsony vagy túl magas
a környezethez képest, érdemes ellenőrizni a szenzor pontosságát

6. Nem megfelelő meghajtóprogramok

Sajnos nagyon sok hibás meghajtóprogrammal lehet találkozni, melyek által a vezérlőre (alaplapra) kötött merevlemezek egyikéről-másikáról nem lehet S.M.A.R.T. adatokat kiolvasni. A jelenség általában független a használt szoftvertől, mivel a merevlemezhez való hozzáférés hasonló elven alapul. Az sem ritka, hogy két merevlemez esetén mindkettőről ugyanazokat a működési értékeket szolgáltatja a vezérlő (általában az első lemez vagy primary master adatait). A szoftverek egy része ezt kiszűri, de gyanú esetén érdemes megbizonyosodni erről: ha a lemezek sorozatszáma, S.M.A.R.T. adatai feltűnően azonosnak tűnnek, akkor ott ilyen helyzet áll fenn.

Általánosan a meghajtóprogramok a merevlemezparancsok egy részét támogatják csak. Emiatt bizonyos funkciók nem minden esetben működnek (pl. akusztika menedzsment), még ha a merevlemez támogatja is azt. Emiatt érdemes figyelni, hátha a gyártók közzétesznek frissebb firmware-t, illetve újabb drivercsomagot, mellyel a helyzet javulhat. Amennyiben a vezérlőhöz RAID-es és nem-RAID-es drivercsomag is telepíthető, fontos a megfelelő változat telepítése. Ellenkező esetben általában búcsút mondhatunk a vezérlőre kötött merevlemez részletes adatainak (hőmérséklet, egészségi állapot stb.). Windows Vista alatt a néhol még félkész meghajtóprogramok miatt szintén ütközhetünk nehézségekbe a S.M.A.R.T. kiolvasásakor, de remélhetőleg ez idővel javulni fog.

7. Nem megfelelő hardver vagy hibás adatok

Ez a probléma szorosan kapcsolódik az előzőhöz. Bizonyos vezérlők, alaplapok használata esetén a S.M.A.R.T. küszöbök értéke nem kérdezhető le, vagy mindegyik küszöb 0. Az ilyen vezérlőre kötött merevlemezek sosem fognak hibát előrejelezni, hiszen egyik érték sem csökkenhet ez alá a szint alá. Az egyes szoftverek is tévesen kitűnőnek értékelhetik a merevlemezt, mivel az attribútumok értékei nagyon távol esnek a küszöbszinttől.


Minden küszöb 0 – az „örökké” fiatal és egészséges merevlemez. Vagy mégsem? [+]

Nem ritka az sem, hogy a visszaadott adatok hiányosak. Ez ugyan nem befolyásolja közvetlenül a lemez állapotát, de ilyenkor bizonyos kijelzett adatok (például az aktuális működési sebesség, Serial ATA működési tulajdonságok stb.) hitelessége megkérdőjelezhető – szerencsére ez nem befolyásolja a hőmérséklettel és az egészségi állapottal összefüggő információk lekérdezését. Az újabb szoftverek figyelmezetetnek ennek lehetőségére, az ATA ellenőrző szó kiolvasásával.


Ideális esetben a driver minden adatot pontosan ad vissza

Hibás szektorok?

Többször előforduló kérdés, hogy mit jelentenek a „hibás szektorok”, hogyan lehet ezeket orvosolni. Sokan furcsának tartják ezt, hiszen a lemez felületét ellenőrző szoftverek (mint a Windows lemezellenőrző) nem jeleznek hibás területet, akkor hogy is van ez?

A merevlemezben található önellenőrző algoritmus a következőképpen működik: mikor a lemez felületén problémát (hibás szektort) észlel, elkezdi onnan az adatokat átmenteni a tartalék adatterületre. Ilyenkor az eredeti helyet megjelöli hibásnak és minden további (ide irányuló) írás és olvasás átirányításra kerül a tartalék területre.

A folyamat végén az eredeti, hibás terület szoftveres úton nem érhető el többé. Ezért (többszöri) formázás és újratelepítés után sem mutat a lemez hibát, mivel valójában a hibásnak minősített adatterület ilyenkor nem esik formázás (ellenőrzés) és használat alá. Emiatt például az említett alkalmazás (Scandisk) sem talált hibát a felületen, még alapos teszteléssel sem. Egyedül a hardveres biztonsági törlés funkció éri el ezt a területet is, mely törli az esetlegesen ott maradt információt is. A DOS-os formázás a mai modern merevlemezeknél (a S.M.A.R.T. tevékenysége miatt) gyakorlatilag sosem talál hibás szektort (illetve csak akkor, ha a tartalék terület már megtelt, de ez valóban ritka).

Az adatok átmentése nem minden esetben problémamentes (bár tény, hogy a lemezek sokat fejlődtek ilyen téren az elmúlt évek alatt). Legjobb esetben az átmentés gond nélkül lezajlik, de a rendszert ez rövidebb-hosszabb ideig megakaszthatja, veszélyeztetheti annak stabilitását. Ideális esetben a felhasználó nem vesz észre semmit a fenti procedúrából, csak mikor már a S.M.A.R.T. egyik pillanatról a másikra riaszt – ha ugyan megéri a lemez, hogy a valamely attribútum értéke (mondjuk a hibás szektorok száma) alapján elérje a küszöböt.

Mire jó akkor a S.M.A.R.T.?

Összefoglalva tehát: a merevlemezek eltérőek, eltérő az elhasználódási karakterisztikájuk, a S.M.A.R.T. sem egységes (még adott gyártón belül sem), és nem is vizsgálja az adatokat megfelelő összefüggésekben, ráadásul néha a gyártók is kozmetikázzák az adatokat. A helyzet nem túl rózsás.

A Hard Disk Sentinel megoldása – I.

A S.M.A.R.T. mögötti ötlet szép, a valóság sokkal kiábrándítóbb. Szerencsére nincs minden veszve, pusztán nekünk kell a S.M.A.R.T. adataiból épkézláb következtetéseket levonni. Ezt megtehetjük kellő szakértelemmel a nyers adatokat elemezgetve, de sokkal egyszerűbb egy megfelelő szoftvert igénybe venni, ami segít eligazodni a S.M.A.R.T. adatok kavalkádjában.

A S.M.A.R.T. specifikációja szerint egy probléma észlelésétől és jelentésétől még 24 órát kell a merevlemeznek működnie, amíg az adatok mentése folyik – szakértők szerint azonban a legtöbb esetben ez nagyon kevés, alaposabb megelőzésre van szükség. Egy ilyen program a magyar fejlesztésű, beszédes nevű Hard Disk Sentinel, azaz Merevlemez Őrszem.

A Hard Disk Sentinel koncepciója és működése

Az valóban elég ritka, hogy minden különösebb ok nélkül egy merevlemez elhalálozzon, kivéve a leesést, túlfeszültséget, természeti katasztrófát, melyeket értelemszerűen nem jelez előre a S.M.A.R.T. (sem). Általában néhány hibás szektor megjelenik, ezek száma egyre nő, a lemez állapota lassan, de folyamatosan romlik – akár hetek is elmúlhatnak „tünetmentesen”. Más esetben a magas hőmérséklet és/vagy kevés számú, de nagyon kritikus hiba (például felpörgés sikertelensége) adhat okot aggodalomra.

Nem ritka az sem, hogy több különböző probléma jelentkezik, melyek együttes hatása más és más hibára enged következtetni. Például ha a merevlemez nehezen (csak többszöri újrapróbálkozás után) vagy lassan pörög fel (mely motor-, illetve csapágyhibára enged következtetni), annak nyoma van a S.M.A.R.T. adatmezőkben. De akár csak egyetlen újabb hibás vagy gyenge szektor is bejegyzésre kerül, tehát minden változás (még ha csekély mértékű is) észlelhető.

Fontos, hogy ezeket a jeleket időben felismerjük és jóval az adatvesztés előtt fel tudjunk lépni. Ezért lényeges, hogy a korábban használt modellt teljesen mellőzve, a gyártóspecifikus küszöbértékeket (vagy azok hiányát, rossz megválasztását) figyelmen kívül hagyva a nyers mért értékeket vegyük alapul, azok alapján alkossunk véleményt a merevlemezről, lehetőség szerint az egyes attribútumok közötti kölcsönhatást, összefüggést is vizsgálva. Így valós képet kaphatunk a lemez állapotáról, megtudhatjuk, mi okoz problémát, és esetleg mit tehetünk a védekezés, megelőzés érdekében.

Érdemes az értékelést a merevlemez használatának, és az adatok fontosságának figyelembevételével megválasztani. Egy komolyabb használat alatt álló, nagyobb igénybevételű (például szerverben vagy hordozható számítógépben lévő), illetve kritikus adatokat tartalmazó merevlemez esetén a legkisebb hiba is végzetes lehet, így fontos, hogy bármilyen apró botlás, hiba esetén azonnal lépni lehessen.

A szoftverek egy része képes ilyen módon (módokon) értékelni a merevlemez állapotát, valamint szöveges értékelést készíteni, esetleges tippeket adni a problémák orvoslására. Hasznos funkció, ha az esetleges új problémák észlelésekor a szoftver nem csak passzívan tud figyelmeztetni (például hangjelzéssel, üzenet küldésével, lekapcsolással), hanem aktívan is képes fellépni, például teljes vagy részleges adatmentési (archiválási) feladatok indításával.

A Hard Disk Sentinel kialakítása a fentiek figyelembevételével történt. A fejlesztés során a Králik és Társa Kft.-hez adatmentésre érkezett merevlemezek S.M.A.R.T. adatait elemezve készült el a lemezek értékelését végző modul, mely a szöveges értékeléssel együtt pontos képet ad a valóban előforduló problémákról. A fejlesztés során lehetőség volt megvizsgálni számos különböző gyártójú és típusú merevlemez állapotát – melyek már csak komoly adatmentő módszerek segítségével voltak működőképesek. Fontos megemlíteni, hogy ezen merevlemezek túlnyomó többségénél a „hagyományos” S.M.A.R.T. valóban nem jelzett meghibásodás előtt.

Egy szemléletes példa

Az alábbi S.M.A.R.T. attribútumokkal rendelkező merevlemez működésképtelen állapotban került adatmentésre:

 

Azonosító Attribútum neve Küszöb Érték Legrosszabb Adat Állapotjelzők Kritikus?
1 Raw Read Error Rate 50 100 100 000000000000 000B igen
2 Throughput Performance 50 100 100 000000000000 0005
3 Spin Up Time 1 100 100 0000000001E9 0027
4 Start/Stop Count 0 100 100 000000000A5A 0032
5 Reallocated Sectors Count 50 100 100 000000000015 0033 igen
7 Seek Error Rate 50 100 100 000000000000 000B igen
8 Seek Time Performance 50 100 100 000000000000 0005
9 Power-On Time Count 0 87 87 0000000014C1 0032
10 Spin Retry Count 30 152 100 000000000000 0033 igen
12 Drive Power Cycle Count 0 100 100 0000000009EA 0032
192 Vendor-specific 0 100 100 000000000058 0032
193 Load/Unload Cycle Count 0 73 73 00000004218D 0032
194 HDD Temperature 0 100 100 003B00020024 0022
196 Reallocation Event Count 0 100 100 00000000000F 0032
197 Current Pending Sector Count 0 100 100 000000000004 0032
198 Off-Line Uncorrectable Sector Count 0 100 100 000000000000 0030
199 Ultra ATA CRC Error Count 0 200 200 000000000000 0032
220 Disk Shift 0 100 100 0000000000B3 0002
222 Loaded Hours 0 95 95 0000000007EA 0032
223 Load/Unload Retry Count 0 100 100 000000000000 0032
224 Load Friction 0 100 100 000000000000 0022
226 Load-in Time 0 100 100 00000000017F 0026
240 Head flying hours 1 100 100 000000000000 0001 igen

A BIOS által támogatott S.M.A.R.T. ellenőrzés problémát nem jelzett. A táblázatot áttanulmányozva látható, hogy az Érték oszlopban található számok (100, illetve a felettiek) a Küszöb értékektől nagyon távol állnak, sőt többségük (a 100-as értékek) el sem mozdult a maximális kondíciót jelző szintről. Emiatt a gyártóspecifikus értékek elemzésével a merevlemez nemhogy hibásnak nem mutatja magát, de a kondíciója tökéletesnek tűnik. A 100-nál alacsonyabb értékek a merevlemez működési idejéből adódnak, mindazonáltal a lemez összesen csak 5313 órát (0x14C1) töltött bekapcsolva (jelen merevlemeznél a teljes működési időt a gyártó vélhetőleg jól adta meg, azt kiszámítva nagyjából 4,7 évet kapunk napi 24 órás üzemmódban használva: (5313/0,13)/24/365 = 4,665 év). Tehát elhasználódásról még szó sem lehet.

Ezzel szemben a Hard Disk Sentinel értékelő algoritmusa segítségével egészen más eredményt kapunk. Mivel a kérdéses merevlemez egy hordozható számítógépben használt 2,5 hüvelykes példány, a szigorúbb értékelési módszer segítségével kerül értékelésre a merevlemez állapota. Az értékelésben részt vesznek azon attribútumok is, melyek funkciójuk szerint felelősek a lemez valós állapotáért – még ha azok a gyártó szerint nem is kritikusak.

A kondíció számítása (figyelembe véve az 5-ös, 196-os, 197-es attribútumok Adat mezőjében található értékeket):

100 x (100 – 10 x 6) x (100 – 30) x (100 – 4 x 4) = 23,52%

Az értékelés alapján a merevlemez kondíciója igencsak aggasztó. A szoftver alaphelyzetben ilyen kondíció esetén már figyelmeztet, hogy adatvesztés várható. A megfelelő számítási módszer kiválasztásával és a megfelelő riasztási szint beállításával még akár ennél korábban is jelezhető lett volna az adatvesztés ennél a merevlemeznél – ha a megfelelő szoftvert előzőleg telepítik.

A Hard Disk Sentinel megoldása – II.

A Hard Disk Sentinel funkciói

Mit is tud ez a Professional változatában is mindössze 6 megabájtos telepítőjű program? Rendkívül sokat. Az alapvető funkció a merevlemezek S.M.A.R.T. adatainak kiolvasása és kiértékelése, azonban már ezek megjelenítésére is számos lehetőségünk van.

A főablakban áttekintést kapunk a rendszerünkben található diszkekről és állapotukról, illetve a program összes beállítása az itt található menükből hajtható végre. A legtöbb paramétert részleteiben is vizsgálhatjuk, vagy könnyen áttekinthető ikonokkal, diagramokkal értesülünk az állapotukról. Számunkra a legfontosabb a Kondíció, amely a Hard Disk Sentinel saját értékelése a merevlemezünkről.


[+]

Minden egyes diszkről részletes információkat kérhetünk le, és a program telepítése óta készült naplót is megtekinthetjük.


[+]

Ha eleget búvárkodtunk a részletekben, a főablakot becsukva is számos lehetőségünk van a merevlemezeink állapotának szemmel tartására:


Az információ közvetlenül az asztalon is megjeleníthető


Testre szabható státusz ablak és lehetőség a szabad hely kijelzésre egy kattintással


A tálca ikonon a színek segítségével érzékeltethető a hőmérséklet.
A megjelenő buborékban a lemezről részletesebb információ kapható.


Szinte minden részlet testre szabható – mi, hol és milyen formában jelenjen meg [+]

Természetesen nem szükséges állandóan az ikonok színét figyelni, a Hard Disk Sentinel képes vészhelyzet esetén riasztásra is. Hogy pontosan miért és hogyan riasszon, és milyen egyéb intézkedést végezzen ilyenkor, ez is mind egyedileg beállítható.


[+]

Eseményről számos helyen tájékoztat(hat) a program, többek között a tálcai ikonnal, felugró buborékkal, a státusz ablaknál, hangjelzéssel vagy akár e-mailben. Lehetőség van riasztási eseménykor a számítógép lekapcsolására, illetve a Hard Disk Sentinel Professional változat esetében automatikus mentés készítésére is.

Lehetőség van riportokat készíteni text vagy html formátumban, akár automatikus e-mail küldéssel is. A fejlesztőknek küldött riportfájllal a program további fejlesztését is elősegíthetjük.

A Hard Disk Sentinel változatai

A Hard Disk Sentinel tehát egy rendkívül sokoldalú segédprogram, amely ráadásul funkcionálisan is átgondolt. Az alapvető funkcióin túl is egy kerek, okosan felépített szoftver: van automatikus online frissítője, képes szolgáltatásként futni (így nincs szükség rendszergazdai jogosultságra vagy aktív, belépett felhasználóra a program futtatásához), tizenkét nyelven beszél, továbbá alaposan kidolgozott dokumentációval rendelkezik (súgó és weboldal). Ráadásul a program folyamatos fejlesztés alatt áll, ezért rendszeresen frissül újabb funkciókkal.

A program jelenleg három változatban létezik. Az ingyenesen használható változattal az összes információhoz hozzájutunk, azonban az aktív riasztási funkciók eléréséhez már meg kell vásárolnunk a 4500 forintos regisztrált változatot.

A 7000 forintos Professional változat tartalmazza a biztonsági mentési modult is, ami a szerény ártöbblettel szemben meglehetősen széles szolgáltatás kört nyújt. Lehetőség van teljes vagy különbözeti mentést készíteni a meghatározott diszkekről/mappákról/fájlokról. A mentési cél tetszőleges helyi vagy hálózati meghajtó lehet, de a 7-Zip és WinRAR tömörítő, és Nero CD/DVD-író programokat is képes automatikusan kezelni a Hard Disk Sentinel mentő modulja. Egyszerre több mentési projekt is beprogramozható, amelyek akár egymással is összekapcsolhatók. Van lehetőség eseménykezelésre, például romló diszkállapot esetén automatikus mentésre.

Vegyünk egy példát:

  • Projekt 1: kijelölt adatmappák teljes mentése minden szerdán
  • Projekt 2: kijelölt adatmappák különbözeti mentése minden nap végén
  • Projekt 3: legkritikusabb mappák mentése romló diszk esetén, majd a PC leállítása
  • Az archiválási stratégiákról köteteket lehet írni – alapszabályként annyit jegyezzünk meg, hogy fontos adatainkról rendszeresen készítsünk biztonsági másolatot. Egy automatikus rendszer, mint a Hard Disk Sentinel mentő opciója, jelentősen megkönnyíti ezt a feladatot.

Merevlemezünk értékelése, adataink védelme

Önmagában, ha a merevlemez kondíciója alacsony, nem jelenti azt, hogy a merevlemez biztosan meg fog hibásodni az elkövetkezendő időszakban (ehhez tüzetesebb – nem szoftveres – vizsgálatok szükségesek), de reális esély van rá. A korábbi példában említett merevlemez problémája nehezen detektálható, valóban kevés nyomot hagy a S.M.A.R.T. táblázatban. Más probléma esetén más merevlemezek (akár ennél alacsonyabb kondícióértékkel is) nem kizárt, hogy hosszú ideig üzemelnek még; például rövid ideig tartó túl nagy hőmérséklet, nem megfelelő tápellátás által okozott problémák maguktól nem javulnak meg, de az ok elhárításával a merevlemez további élettartama meghosszabbítható. Mindazonáltal az ilyen lemezeket érdemesebb fokozottabb figyelemmel működtetni, és gondoskodni róla, hogy a tárolt adatok egy másik, lehetőség szerint jobb állapotú eszközön is rendelkezésre álljanak.

További néhézségek a S.M.A.R.T. körül

A korábban említett, meghajtóprogrammal és vezérlővel kapcsolatos problémák mellett jellemzően gondot jelent a külső házba szerelt merevlemezek S.M.A.R.T. adatainak lekérése, ugyanis egyelőre csak kevés olyan chipset van, amelyik az USB vagy FireWire kapcsolaton is átküldi a S.M.A.R.T. értékeket. Itt sajnos nem lehet mást tenni, mint reménykedni, hogy a gyártók mihamarabb jobb belátásra térnek, és a S.M.A.R.T.-ot megfelelően kezelő termékeket dobnak piacra, illetve külső merevlemezek vagy házak vásárlásakor érdemes tájékozódni, hogy a kiszemelt eszköz hogyan viszonyul a problémához. A Hard Disk Sentinel weboldalán elérhető egy rendszeresen frissülő kompatibilitási lista.

Hogyan vigyázzunk merevlemezünkre?

Alapvető fontosságú, hogy merevlemezünket megfelelő környezetben üzemeltessük, és ez rögtön a számítógép-konfigurációval kezdődik. Gyenge minőségű alkatrészekből összeállított konfiguráció is vezethet adatvesztéshez: egy ingadozó tápegység vagy kontakthibás tápcsatlakozó miatt is keletkezhetnek hibák, a megfelelő túlfeszültség elleni védelem hiánya pedig táphiba esetén könnyen vezet füstölgő komponensekhez. Egy sérült vagy hibás adatkábel is okozhat adatvesztést.

Elsőrangú környezeti paraméter a merevlemez hőmérséklete, és a mai diszkek a többi belső komponenshez hasonlóan szeretnek melegedni, így a hűtésükről érdemes gondoskodni a megfelelő élettartam és adatbiztonság elősegítése érdekében. Egy kevés légáramlás is már nagyon sokat segíthet.

A merevlemezek nagyon nem kedvelik a mozgatást, ütögetést, kiváltképp működés közben. Pedig a diszkek specifikációit böngészve első ránézésre hatalmas gyorsulásértékek vannak megadva, amit ki kell bírjanak, főleg a mobilitásra tervezett notebook-meghajtók. Evidens módon az ütések jelentős gyorsulást jelentenek, de már egy kisebb esés (például élére állított diszk eldőlése) is veszélyes lehet – itt a landoláskor bekövetkező lassulás (negatív gyorsulás) a veszélyes. A merevlemezek olykor meglepően „sokat” kibírnak, azonban nem kizárt, hogy a külsőre hibátlannak tűnő merevlemez jelentős belső károsodást szenvedett, bár még működőképes. A S.M.A.R.T. mezők elemzése fényt tud deríteni ilyen esetekben is a valós állapotra, de bölcsebb óvatosan kezelni diszkjeinket. Működés közben ne mozgassuk, és csak megfelelő csomagolásban és körültekintés mellett szállítsuk azokat. Notebook esetében is a géppel mindig lehetőleg stabil felületen dolgozzunk, és csak standby vagy hibernált állapotban mozgassuk azt. Amennyiben gyakran kell bekapcsolt notebookkal mozognunk, válasszunk olyan típust, amely gyorsulásérzékelős merevlemez-védelemmel van ellátva, és ez által jobban képes védekezni a rázkódások és ütések ellen.

És a RAID meg az archiválás?

A RAID célja alapvetően az üzembiztosság fenntartása, hogy meghibásodó adattároló esetén is működőképes maradjon a rendszer. Sok helyen (a notebookoknál tipikusan) általában nincs is lehetőség redundáns háttértár használatára. A RAID alkalmazásának célszerűsége erősen függ a felhasználástól, mélységében egy külön elemzés tárgya lehet – alapvetően nem csodaszer az asztali PC-k felhasználói számára.

Az archiválás vagyis a biztonsági másolat készítésének célja pedig az adatbiztonság. A legjobb lokális védelem sem ér semmit, ha a teljes számítógép megsemmisül (tűz, beázás stb.), vagy eltűnik (lopás, notebook elvesztése). Az archiválás szintén szerteágazó témakör – a legfontosabb azonban, hogy valamilyen formában és rendszerességgel készítsünk biztonsági másolatot adatainkról, a többi elővigyázatossági intézkedés mellett is.

Adatbiztonsági checklist S.M.A.R.T.-alapokon:

  • használjunk minőségi komponenseket PC-nkhez;
  • gondoskodjunk a megfelelő üzemeltetési körülményekről, védjük diszkjeinket a túlmelegedéstől és a mozgatástól;
  • a BIOS-ban engedélyezzük a merevlemezekre a S.M.A.R.T. funkciót;
  • telepítsünk egy megfelelő, valós idejű S.M.A.R.T.-figyelő szoftvert;
  • vegyük komolyan a szoftver riasztásait, és időben cseréljük az elhasználódott merevlemezt;
  • a fontos adatainkról rendszeresen készítsünk biztonsági másolatot.

A S.M.A.R.T. nem univerzális csodaszer, még egy intelligens elemzőszoftverrel kiegészítve sem. A fontos adatainkat kezeljük értékként, válasszunk nekik jó minőségű adathordozót, és rendszeresen készítsünk biztonsági másolatokat.

A Hard Disk Sentinel kitűnő segítséget nyújt merevlemezünk valós állapotának szemmel tartására és adataink megelőző védelmére. Legnagyobb előnye, hogy valódi meghibásodási esetek feldolgozásán alapul, az értékelő mechanizmusa nem csupán a sokszor félrevezető gyári S.M.A.R.T. értékeket jelzi ki, hanem a merevlemezhibák előfordulásának statisztikai jellegéhez mérten pontosabb képet nyújt diszkünk állapotáról.

 

Hard Disk Sentinel

karib

A cikk alapjául Máthé János a S.M.A.R.T.-ról készült elemzése szolgált, az anyag az alkotó hozzájárulásával lett felhasználva. A S.M.A.R.T. iránt behatóan érdeklődő olvasóinknak ajánljuk az eredeti publikáció tanulmányozását.

Azóta történt

  • 750 GB-os nagymenők

    Négy gyártó 750 GB-os merevlemezeit teszteltük. Vajon a kapacitás növelése mellett más előnyökkel is jár a fejlesztés?

Előzmények

Hirdetés