Tanulmány a merevlemezek meghibásodásairól

A Google érdekes tanulmányt tett közzé nemrég a merevlemezek meghibásodásait befolyásoló tényezőkről. Amint a vállalat munkatársai rámutatnak, a meghajtók élettartamát a gyártók viszonylag kisszámú merevlemez teszteredményeiből extrapolálva próbálják meghatározni, illetve bizonyos következtetéseket vonhatnak le a garanciális idő alatt cserélt merevlemezek meghibásodásaiból is. Utóbbival csak az a baj, hogy legtöbbször nincs támpont arra nézve, milyen körülmények között keletkezett a defekt, és a jótállási idő korlátai a hosszútávú megfigyeléseknek sem kedveznek.

A Google a 2005 decembere és 2006 augusztusa közötti időszakban saját szerverparkjából gyűjtött adatokat a merevlemezek állapotáról, meghibásodásairól és ezek körülményeiről. A vizsgálat alapját több mint százezer, a konzumer piacon is elérhető meghajtó adta, melyek között volt 5400 és 7200 rpm fordulatszámú, IDE és SATA csatolós, kapacitásuk pedig 80 és 400 GB között változott. A merevlemezeket 2001-ben vagy később gyártották, több márka és legalább kilenc különböző típus volt a megfigyelés tárgya.

A szerverekben való felhasználásnak megfelelően ezek a meghajtók javarészt egész élettartamuk alatt üzemben álltak. Az egy évnél fiatalabb merevlemezek meghibásodási aránya 1,7–3 százalék volt, a második évtől azonban 6–8 százalékra emelkedett az átlag. A harmadik év több szempontból is kritikus a meghajtók életében, az átlagos meghibásodási arány ekkor a legmagasabb (8,6%) a 0–5 éves időszakot alapul véve. A kutatók szerint szoros korreláció volt a meghibásodási arány és a gyártó, illetve a típus között is, az idevágó eredményeket azonban nem hozták nyilvánosságra.

A meghibásodások és a terhelés összefüggését nézve elmondható, hogy az első hat hónapban kiugró azon winchesterek hibaaránya, melyeket nagy (75 százalékot meghaladó) terhelésnek vetettek alá. Ezután mérséklődik a kis, közepes és nagy terhelésű egységek hibaarányai közötti különbség, sőt a háromévesek közül több kis terhelésű egység adta fel, mint nagy terhelésű. Az is megfigyelhető, hogy a közepes terhelésűekhez képest sem mindig állnak jobban a kevés munkát végzők, ezt azzal magyarázzák a szerzők, hogy a nagyobb terhelésű egységeknél a hibák is hamarabb előjönnek, így nagyobb a valószínűsége, hogy a bentmaradtak már kevésbé érzékenyek erre a tényezőre. Nagyobb különbségek csak az ötödik évben jönnek ismét elő, ekkor a kis és közepes terhelésű lemezek viszonylag kis (1–2% közötti) hibaarányát a nagy terhelésűek 4% fölötti értéke rontja le.

Érdekes, a közhiedelmet több ponton megcáfoló eredményekre jutottak a hőmérsékleti adatok kiértékelésekor is. Eszerint nem igaz, hogy a hőmérséklet növekedésével arányosan nő a hibaarány. Éppenséggel azt tapasztalták, hogy 25 Celsius fok alatt nő meg igazán a hibaarány, 20 foknál már megközelítve a 10 százalékot is. A meghibásodások aránya a 35–45 fokos tartományban volt a legkisebb, és csak efölött kezdett enyhén emelkedni, nem lépve át a 2 százalékot (a szervertermek feltételei miatt a felső határ 51 fok körül volt). A merevlemezek életkorát is figyelembe véve azt lehet elmondani, hogy az első három hónapban a tárolók különösen érzékenyek az alacsonyabb (15–30 fokos) hőmérsékletre, és ez a tendencia csak a harmadik évben fordul meg, amikor a 40 fokot meghaladó hőmérsékleten üzemelő egységek hibaaránya válik a legmagasabbá. Ha viszont ezt az évet túlélik, minden tartományban 4–5 százalék alá szorul a hibaarány, bár ezentúl már érdemes odafigyelni a forróság elkerülésére is.

A nagy mintára alapozó vizsgálat abban is segíthet, hogy a meghibásodást jobban előrejelző paramétereket határozzanak meg, a SMART adatok esetében ugyanis azt találták, hogy egy nagy populációra nézve használható volt a modell, az egyes tárolók meghibásodását azonban nem jelzi megbízhatóan előre. Az Eduardo Pinheiro, Wolf-Dietrich Weber és Luiz André Barroso által jegyzett tanulmány letölthető a Google Labs oldaláról.

Azóta történt

Előzmények

Hirdetés