S.M.A.R.T - interpretacja parametrów.doc

(51 KB) Pobierz

S.M.A.R.T - interpretacja parametrów 

S.M.A.R.T. (ang. Self-Monitoring, Analysis and Reporting Technology) – system monitorowania i powiadamiania o błędach działania twardego dysku. Technologia ta została zaimplementowana w dyskach ATA-3, późniejszych ATA, ATAPI, IDE oraz SCSI-3, aby zwiększyć bezpieczeństwo składowanych danych. Dzięki niej dysk potrafi ocenić swój stan i jeśli awaria jest wysoce prawdopodobna zaalarmować system operacyjny i użytkownika komputera. System zapewnia skuteczne ostrzeganie o zbliżającej się awarii w około 30 do 40% przypadków. (źródło: Wikipedia)
Każdy dysk twardy posiada opcję S.M.A.R.T. Producenci dysków w celach bezpieczeństwa zaopatrzyli użytkownika w ten właśnie system.
S.M.A.R.T. włanczamy w biosie komputera. Teoretycznie powinien być właczony automatycznie. Jeżeli natomiast z jakichś powodów nie mamy go włączonego to dla bezpieczeństwa proponuję włączyć w zakładce SETUP (lub innej w zależności od wersji Biosu)

Wyniki testu S.M.A.R.T. odczytujemy między innymi za pomocą programów:
- Everest
- HD Tune
- SpeedFan
- Active SMART
Oczywiście jest jeszcze masa innych dostępnych na rynku programów (np. Sisoft Sandra) które posiadają opcję odczytu testu S.M.A.R.T jednak dla pewności i z doświadczenia radziłbym używać wymienionego softu.

Opiszę teraz w jaki sposób należy interpretować wyniki testu S.M.A.R.T;

Self-Monitoring
Podczas pracy dysku system S.M.A.R.T na bieżąco monitoruje istotne parametry, każdy z nich może przyjąć następujące stany:

- Pre-failure warranty attribute (PW)- Wskazuje warunek przed awaryjny, może uchronić od straty wielu danych.
- Online collection attribute (OC)- Oznacza, że wartości są obliczane podczas pracy dysku.
- Performance attribute (PE)- Oznacza pogorszenie spowodowane zużyciem lub wiekiem dysku.
- Error rate attribute (ER) - Oznacza parametr czestości pomiaru błędów.
- Error count attribute (EC) - Oznacza parametr ilości zmierzonych błędów.
- Self-preserving attribute (SP)- Oznacza parametr który jest automatycznie ustawiany podczas testu S.M.A.R.T.

Najczęstsze monitorowane parametry:

UWAGA: Wszystkie wartości stwierdzające problem zapisywane są w polu Data

01 Raw Read Error Rate - Atrybut ten zależy od ilości błędów odczytu i stanu powierzchni dysku, wskazuje na częstość sprzętowych błędów odczytu, które wystąpiły podczas odczytu danych z powierzchni dysku (talerza). Wartości w przedziale Data wskazują na problem z powierzchnią dysku lub głowicami odcztu/zapisu. Jest to parametr określający błąd krytyczny dysku twardego. Często wywołany jest uszkodzeniem mechanizmu napedowego dysku/głowic (łożysko etc.) lub podzespołów elektronicznych.
UWAGA: Dyski Seagate nie monitorują parametru Raw Read Error Rate, stąd tak wysokie wartości podczas testu S.M.A.R.T

Przykład:

Dla dysku Seagate:

===================================================================

KOD

ID                                         Current  Worst   Threshold           Data                  Status
      01 Raw Read Error Rate    59       51             6               14142379                 Ok

 

 

Dla dysku Western Digital:

 

KOD

ID                                         Current  Worst   Threshold           Data    Status
      01 Raw Read Error Rate   200      199            51                 0            Ok

 

 

Curent - próg wystąpienia błedu
Worst - wartość dla modelu dysku
Treshold - najgorsza wartość (poziom krytyczny) przy jakiej były problemy odczytu RAW
Data - wartość na chwilę obecną

02 Throughput Performance - Łączna (ogólna) sprawność dysku. Jeśli wartość tego atrybutu się obniża jest duża szansa, że zbliżają się problemy z dyskiem. Nie jest to błąd krytyczny. Niestety nie każdy program monitoruję tą wartość.
03 Spin Up Time - Średni czas na rozkręcenie (rozpędzania) tależy (od 0 obr/min do pełnej prędkości). Wartość RAW tego atrybutu wyraża czas w sekundach lub milisekundach. Zależnie od modelu dysku. Nie jest to błąd krytyczny, ale wysokie czasy rozpędzania talerzy świadczą o pojawiających sie problemach z układami mechanicznymi dysku.
04 Start/Stop Count - Wartość RAW tego atrybutu określa liczbę cyli start/stop dysku. Nie jest to błąd krytyczny, ale w połączeniu z parametrem 09 Power-On Time Count i 10 Spin Retry Count daje obraz o sposobie użytkowania dysku. Czas startu dysku powinien być zblizony do ilości prób rozpędzania talerzy. Zbyt duże różnice pomiędzy tymi parametrami swiadczą o problemie z zasilaniem dysku, który uruchamia sie poprawnie, ale nie rozpędza talerzy. Nie tylko jest to wina zasilania.
05 Reallocated Sectors Count - Ilość realokowanych sektorów (określanych również jako: "bady", "bad sectors"). W momencie gdy dysk napotyka błąd odczytu/zapisu/weryfikacji, oznacza ten sektor jako realokowany i przenosi dane do specjalnego zarezerwowanego obszaru (obszaru rezerwowego). Proces ten jest również określany mianem remapowania a realokowane sektory określa się remapami. To właśnie dlatego, na nowoczesnych dyskach, nie widzimy "bad bloków" podczas testów powierzchni - jest to błąd krytyczny, świadczy o powstaniu logicznych lub fizycznych "badów". Odczytując tą wartość możemy stierdzić czy posiadamy na dysku "bad sectory".
06 Read Channel Margin - Rezerwa kanału podczas odczytu danych. Funkcja tego atrybutu nie jest objęta specyfikacją. Nie informuje o błędzie krytycznym.
07 Seek Error Rate - Częstość błędów wyszukiwania głowic magnetycznych. W razie uszkodzenia mechanicznego systemu pozycjonowania, uszkodzenia serwa albo termicznej rozszerzalności dysku, ilość błędów wyszukiwania wzrasta.
Więcej błedów wyszukiwania oznacza pogarszanie się stanu powierzchni dysku i podsystemu mechanicznego dysku. Nie jest to błąd krytyczny, ale warto go monitorować.
08 Seek Time Performance - przeciętna wydajność operacji wyszukiwania głowic magnetycznych. Jeśli wartość atrybutu maleje, jest to oznaka problemów z podsystemem mechanicznym dysku.
09 Power-On Time - Ilość godzin w stanie zasialnia. Wartość RAW atrybutu odpowiada łącznej ilości godzin (lub minut, sekund, w zależności od producenta) przepracowanych przez dysk. Zmniejszenie się tej wartości do poziomu krytycznego (threshold) wskazuje na zmniejszenie się parametru MTBF (średni czas między awariami). Niemniej, w rzeczywistości, nawet jeśli MTBF zmaleje do zera, nie oznacza to że zasoby MTBF całkowicie się wyczerpały i dysk przestanie działać.
0A Spin Retry Count - Ilość ponowień prób rozpędzenia tależy. Atrybut ten przechowuje łączną ilość prób uruchomienia tależy przed osiągnięciem pełnej szybkości obrotowej (pod warunkiem, że pierwsza próba nie powiodła się). Spadek tego atrybutu jest oznaką problemów z podsystemem mechanicznym dysku.
0B Recalibration Retries- Atrybut ten wskazuje liczbę rządań rekalibracji (po warunkiem, że pierwsza próba nie powiodła się). Spadek tego atrybutu jest oznaką problemów z podsystemem mechanicznym dysku.
0C Device Power Cycle Count- Atrybut ten określa łączną ilość pełnych cykli zasilania dysku.
0D Soft Read Error Rate - Jest to ilość programowych błędów odczytu występujących podczas odczytu danych z powierzchni dysku.
0E G-Sense Error Rate - częstotliwość występowania błędów spowodowanych wstrząsem. Atrybut ten przechowuje wskazania czujnika przeciążeń i podaje łączną ilość błędów występujących jako rezultat wewnętrznych przeciążeń (upuszczenia dysku, niewłaściwej instalacji, i tp.).
0F Power Cycle Count - Atrybut ten określa ile razy dysk był wyłączany. Właściwie to określa ilość naprawionych cykli włanczania dysku. W połączeniu z parameterm 04 Start/Stop Countinformuje o problemie z zasilaniem dysku.
0G Load/Unload Cycle Count - Ilość cykli parkowania/wyparkowania ze strefy parkowania (Landing Zone).
C2 Temperature - Temperatura dysku twardego. Wartość RAW tego atrybutu podaje wskazania wbudowanego czujnika ciepła (w stopniach Celsjucza). Czesto zdaża się ,że czujnik temperatury jest uszkodzony więc wartość ta jest bardzo duża lub wogóle nie monitorowana.
C4 Reallocation Event Count - Ilość operacji remapowania (przenoszenia danych z uszkodzonego sektora do specjalnego zarezerwowanego obszaru - obszaru rezerwowego). Wartość RAW tego atrybutu określa łączną ilość prób transferu danych z realokowanego sektora do obszaru rezerwowego. Liczone sa zarówno próby udane jak i nieudane. Jest to nie wątpliwie jeden z wżniejszych parametrów, dzieki któremu możemy usunąć poprzez remap/zerowanie kolejne (będące w drodze) bad sectory.
C5 Current Pending Sector Count - Parametr ten określa iczbę sektorów niestabilnych (oczekujących na remapowanie). Dysk podczas próbuy odczytu/zapisu odznaczył te sektory jako niestabilne. Bedą one oczekiwać na remap powierzchni talerz. Jeżeli tego nie zrobimy wówczas dysk przeniesie je do obszaru Reallocated Sectors Count, a tym samym powstaną nowe bad sectory.
Jest to błąd jak najbardziej krytyczny i warto go monitorować.
C6 Off-line Uncorrectable Sector Count - Ilość niekorygowalnych błędów. Wartość RAW tego atrybutu wskazuje łączną ilość niekorygowalnych błędów podczas odczytu/zapisu sektora. Wzrost wartości tego atrybutu wskazuje na ewidentne defekty powierzchni dysku i/lub problemy z podsystemem mechanicznym dysku. Jest to błąd krytyczny, świadczy o poważnym uszkodzeniu tablicy talerza lub nadchodzącym uszkodzeniu mechanizmu dysku.
C7 UltraDMA CRC Error Count - Łączna ilość błędów CRC w trybie UltraDMA. Wartość RAW atrybutu wskazuje ilość błędów wykrytych przez CRC (CRC Interfejsu) podczas przesyłania danych w trybie UltraDMA. Wysokie wartości świadczą o uszkodzeniu podzespołów elektronicznych dysku. Jednocześnie parametr ten informuje nas o tym, że dysk ma problemy w komunikacji z kontrolerem (dysk<->płyta<-dysk). Najczęstszą przyczyną pojawiania sie tego błędu jest: uszkodzona wstęga (taśma), fiksujący zasilacz, uszkodzona elektronika dysku, uszkodzona elektronika płyty głównej.
C8 Write Error Rate (Multi Zone Error Rate) - Częstość błędów zapisu. Atrybut ten wskazuje na łączną ilość błędów zapisu podczas zapisywania sektora. Im wyższa wartość RAW, tym gorszy stan powierzchni dysku i/lub mechanicznego podsystemu. W połączeniu z parametrem Raw Read Error Rate informuje nas o stanie talerzy, a włąściwie zapisu na ich powierzchni.
Wartość 0 (zero) oznacza iż dysk jest sprawny i nie wykazuje tych błedów. Inne wartośc świadczą o pronlemie zapisu/odczytu z powierzchni talerza. Monitorujmy tą wartość. Jest to błąd krytyczny. Czesto duże wartośc w polu Data zmniejszają szanse na poprawne działąnie dysku, który z czasem pewnie ulegnie uszkodzeniu. Warto pamietać o zabezpieczeniu danych z takiego dysku.

Inne parametry jakie monitoruje S.M.A.R.T:

Disk Shift - Przesunięcie dysków od osi. Wartość RAW pokazuje jak bardzo dysk został przesunięty. Jednostka miary jest nieznana.
UWAGA: Przesunięcie dysków jest możliwym rezultatem silnego uderzenia lub upadku. Niewątpliwie błąd krytyczy.
Loaded Hours -Użycie akuratora głowic magnetycznych spowodowane normalną eksploatacją. Liczy się tylko czas działania akuratora.
Load/Unload Retry Count - Użycie akuratora głowic magnetycznych spowodowane licznymi wystąpienia operacji takich jak: odczyt, zapis, pozcjonowanie głowic i tp. Liczy się tylko czas gdy głowice były w stanie działania.
Load Friction - Użycie akuratora głowic magnetycznych spowodowane tarciem mechanicznych części dysku. Liczy się tylko czas gdy głowice były w stanie działania.
Load-in Time - Łączny czas działania akuratora głowic. Atrybut ten wskazuje łączny czas w którym dysk był obciążony (przy założeniu, że głowice były w stanie działania, poza obszarem parkowania).
Torque Amplification Count - Ilość prób rozkręcenia tależy dysku.
GMR Head Amplitude - Amplituda drgań głowic (GMR-head) w czasie pracy.
Head Flying Hours - Czas w jakim głowica jest pozycjonowana.
Read Error Retry Rate - częstotliwość występowania błędów podczas odczytu.

Na podstawie: http://www.ariolic.com/

Pamiętaj monitoruj swój dysk!!!

 

 

...
Zgłoś jeśli naruszono regulamin