[elektro-etc] lemezmeghibásodások a Google-tól
Palasik Sandor
palasik at mail.datanet.hu
Mon Feb 19 13:10:54 CET 2007
> > Talán érdekes lehet: a Google csinált egy tanulmányt arról, hogy
> > miért és hogyan purcannak ki a merevlemezek:
> >
> > http://labs.google.com/papers/disk_failures.pdf
> Pár szóban leírnád, miket írnak?
Kb. százezer lemez sorsát vizsgálták, amit HÁZON BELÜL használtak :-)
Próbálták kitalálni, mitől függ a meghibásodási arány és hogyan lehet
előrejelezni. Eleve már ez érdekes, hogy házon belül olyan rendszerük van,
hogy bármelyik lemez bármelyik paraméterét bármely korábbi időpontra ki
tudják keresni, pár perces felbontásban. Biztosan fontos nekik, de azért nem
semmi.
Először is kiderült, nem meglepő módon, hogy függ a terheléstől. De az is
kiderült, hogy az erősen terhelt lemezek vagy kipurcannak az első évben,
vagy végelgyengülésben az ötödik évben. A másodiktól negyedik évig nem
találtak lényeges eltérést a terhelés miatt.
A második a hőmérséklet. Úgy találták, hogy a hőmérséklet nem egyértelműen
árt a lemezeknek, csak ha nagyon magas. Sőt az derült ki, hogy a 35-40 fok
közötti lemezhőmérsékletnél a legritkábbak a meghibásodások.
Találtak pár SMART paramétert, amik utalhatnak bekövetkező meghibásodásokra:
scan errors, reallocation counts, offline reallocation counts, probational
counts. Ebből az elsőt nem tudtam kitalálni, hogy melyik paraméterre
gondolnak, más dokumentekben nem találtam ilyen nevű izét. Gondolom, hogy
valami olvasási hibát jelenthet. A reallocation count az az lenne, ha valami
stabil hibát talál a lemezen és egy tartalék területre átteszi az adatokat.
Az a probational meg valami próbaidős tartalékolás, na erről sem hallottam.
A többi SMART paraméternél semmi érdemleges összefüggést nem találtak a
meghibásodásokkal.
Végül, ami a lényeg: az összes meghibásodott lemez 56 százalékánál SEMMILYEN
előjel nem volt.
Ha nem is röviden, de ennyi. Az eredeti 13 oldal, két hasábban.
Palasik Sándor
More information about the Elektro-etc
mailing list