Am următoarea unitate WD (3TB) care mi-a dat o problemă (nu am putut accesa niciun fișier: chiar și un ls
comanda de pe ea a provocat o așteptare fără sfârșit).
Iată câteva detalii de pe disc:
Disc /dev/sda: 2,7 TiB, 3000592982016 octeți, 5860533168 sectoare
Model de disc: EZRX-00D8PB0
Unități: sectoare de 1 * 512 = 512 octeți
Dimensiunea sectorului (logic/fizic): 512 octeți / 4096 octeți
Dimensiunea I/O (minimă/optimă): 4096 octeți / 4096 octeți
Tip etichetă de disc: gpt
Dispozitiv Start End Sectors Size Type
/dev/sda1 2048 5860532223 5860530176 Sistem de fișiere Linux 2.7T
După această problemă, fac un test pentru a descoperi ce fel de problemă o afectează.
Ca prim pas, fac un scurt test pe el sudo smartctl -t short /dev/sda
care mi-a arătat următoarea eroare:
=== ÎNCEPEREA SECȚIUNII DE CITIRE DE DATE INTELIGENTE ===
Structura jurnalului de autotestare SMART numărul de revizuire 1
Num Test_Description Stare Durată de viață rămasă (ore) LBA_of_first_error
# 1 Scurt offline Finalizat: eșec de citire 90% 17480 8467144
Apoi am încercat să obțin câteva atribute așa cum este descris în această altă postare Înțelegerea ieșirii smartctl -a folosind sudo smartctl -a /dev/sda
. Aici puteți găsi tabelul de atribute și cel mai recent jurnal de erori 5:
Numărul de revizuire al structurii datelor SMART Atribute: 16
Atribute SMART specifice furnizorului cu praguri:
ID# ATTRIBUTE_NAME VALOAREA STRAPHIEI CEL MAI RĂU TIP DE PRAG ACTUALIZAT WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-eșec Întotdeauna - 71
3 Spin_Up_Time 0x0027 174 161 021 Pre-fail Always - 6266
4 Start_Stop_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 695
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Bătrânețe Întotdeauna - 0
9 Power_On_Hours 0x0032 077 077 000 Bătrânețea Întotdeauna - 17481
10 Spin_Retry_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 0
12 Power_Cycle_Count 0x0032 100 100 000 Bătrânețe întotdeauna - 457
192 Power-Off_Retract_Count 0x0032 200 200 000 Bătrânețe Întotdeauna - 63
193 Load_Cycle_Count 0x0032 179 179 000 Bătrânețe întotdeauna - 64193
194 Temperature_Celsius 0x0022 122 101 000 Bătrânețe Întotdeauna - 28
196 Reallocated_Event_Count 0x0032 200 200 000 Bătrânețe Întotdeauna - 0
197 Current_Pending_Sector 0x0032 200 197 000 Bătrânețe Întotdeauna - 356
198 Offline_Uncorectable 0x0030 197 197 000 Bătrânețe Offline - 1691
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Bătrânețe întotdeauna - 0
200 Multi_Zone_Error_Rate 0x0008 196 196 000 Bătrânețe Offline - 1691
Versiunea jurnalului de erori SMART: 1
Număr de erori ATA: 47 (jurnalul dispozitivului conține doar cele mai recente cinci erori)
CR = Registrul de comenzi [HEX]
FR = Registrul caracteristicilor [HEX]
SC = Registrul de numărare a sectorului [HEX]
SN = Registrul de număr de sector [HEX]
CL = Registrul cilindru scăzut [HEX]
CH = Registrul Cilindru înalt [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Registrul erorilor [HEX]
ST = Registrul de stare [HEX]
Powered_Up_Time este măsurat de la pornire și imprimat ca
DDd+hh:mm:SS.sss unde DD=zile, hh=ore, mm=minute,
SS=sec și sss=milisec. Se „împachetează” după 49.710 zile.
A apărut eroarea 47 la durata de viață a pornirii discului: 232 ore (9 zile + 16 ore)
Când a apărut comanda care a cauzat eroarea, dispozitivul era activ sau inactiv.
După finalizarea comenzii, registrele au fost:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 0a 00 00 00 00
Comenzile care au condus la comanda care a cauzat eroarea au fost:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- ------------------- --
e0 00 0a 00 00 00 00 00 04:00:17.522 STANDBY IMMEDIAT
ef 03 46 00 00 00 a0 00 04:00:16.815 SETARE CARACTERISTICI [Setați modul de transfer]
ec 00 00 00 00 00 a0 00 04:00:16.815 IDENTIFICAȚI DISPOZITIV
A apărut eroarea 46 la durata de viață a pornirii discului: 232 ore (9 zile + 16 ore)
Când a apărut comanda care a cauzat eroarea, dispozitivul era activ sau inactiv.
După finalizarea comenzii, registrele au fost:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 46 00 00 00 a0 Defecțiune dispozitiv; Eroare: ABRT
Comenzile care au condus la comanda care a cauzat eroarea au fost:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- ------------------- --
ef 03 46 00 00 00 a0 00 04:00:16.815 SETARE CARACTERISTICI [Setați modul de transfer]
ec 00 00 00 00 00 a0 00 04:00:16.815 IDENTIFICAȚI DISPOZITIV
e1 00 0f 00 00 00 00 00 04:00:15.095 IDLE IMMEDIAT
ef 03 46 00 00 00 a0 00 04:00:14.575 SETARE CARACTERISTICI [Setați modul de transfer]
ec 00 00 00 00 00 a0 00 04:00:14.575 IDENTIFICAȚI DISPOZITIV
A apărut eroarea 45 la durata de viață a pornirii discului: 232 ore (9 zile + 16 ore)
Când a apărut comanda care a cauzat eroarea, dispozitivul era activ sau inactiv.
După finalizarea comenzii, registrele au fost:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 0f 00 00 00 00
Comenzile care au condus la comanda care a cauzat eroarea au fost:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- ------------------- --
e1 00 0f 00 00 00 00 00 04:00:15.095 IDLE IMMEDIAT
ef 03 46 00 00 00 a0 00 04:00:14.575 SETARE CARACTERISTICI [Setați modul de transfer]
ec 00 00 00 00 00 a0 00 04:00:14.575 IDENTIFICAȚI DISPOZITIV
A apărut eroarea 44 la pornirea discului: 232 ore (9 zile + 16 ore)
Când a apărut comanda care a cauzat eroarea, dispozitivul era activ sau inactiv.
După finalizarea comenzii, registrele au fost:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 46 00 00 00 a0 Defecțiune dispozitiv; Eroare: ABRT
Comenzile care au condus la comanda care a cauzat eroarea au fost:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- ------------------- --
ef 03 46 00 00 00 a0 00 04:00:14.575 SETARE CARACTERISTICI [Setați modul de transfer]
ec 00 00 00 00 00 a0 00 04:00:14.575 IDENTIFICAȚI DISPOZITIV
ef 03 46 00 00 00 a0 00 04:00:12.170 SETARE CARACTERISTICI [Setați modul de transfer]
A apărut eroarea 43 la durata de viață a pornirii discului: 232 ore (9 zile + 16 ore)
Când a apărut comanda care a cauzat eroarea, dispozitivul era activ sau inactiv.
După finalizarea comenzii, registrele au fost:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 46 00 00 00 a0 Defecțiune dispozitiv; Eroare: ABRT
Comenzile care au condus la comanda care a cauzat eroarea au fost:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- ------------------- --
ef 03 46 00 00 00 a0 00 04:00:12.170 SETARE CARACTERISTICI [Setați modul de transfer]
ec 00 00 00 00 00 a0 00 04:00:12.170 IDENTIFICAȚI DISPOZITIV
e1 00 0f 00 00 00 00 00 04:00:10.445 IDLE IMMEDIAT
ef 03 46 00 00 00 a0 00 04:00:09.925 SETARE CARACTERISTICI [Setați modul de transfer]
ec 00 00 00 00 00 a0 00 04:00:09.925 IDENTIFICAȚI DISPOZITIV
Structura jurnalului de autotestare SMART numărul de revizuire 1
Num Test_Description Stare Durată de viață rămasă (ore) LBA_of_first_error
# 1 Scurt offline Finalizat: eșec de citire 90% 17480 8467144
Structura datelor jurnalului de autotestare selectivă SMART numărul de revizuire 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Ne_testare
2 0 0 Ne_testare
3 0 0 Ne_testare
4 0 0 Ne_testare
5 0 0 Ne_testare
Indicatori selectivi de autotestare (0x0):
După scanarea intervalelor selectate, NU citiți și scanați restul discului.
Dacă autotestarea selectivă este în așteptare la pornire, reluați după o întârziere de 0 minute.
Apoi am încercat să inspectez pe LBA_of_first_error
(8467144) și, în urma unei părți din acest ghid, Alerg sudo sg_verify --lba=8467144 /dev/sda
obținând următoarea ieșire care îmi confirmă că există o defecțiune hardware:
verifica (10):
Format fix, curent; Tasta Sense: Eroare medie
Sens suplimentar: Eroare ID CRC sau ECC
VERIFY(10) eroare mediu sau hardware lângă lba=0x8132c8
Ca pas final am încercat să reatribuiesc blocul fără succes sudo sg_reassign --address=8467144 /dev/sda
:
BLOCURI DE REATRIBUIRE: cerere ilegală, cod operațional nevalid
sg_reassign failed: cerere ilegală, cod operațional nevalid
Deci, pentru a rezuma, am ratat vreun pas în această investigație a discului? Este unitatea moartă sau mai poate fi folosită? Nu reușesc să înțeleg dacă există erori proaste din lista de atribute SMART, mă puteți ajuta să înțeleg dacă unitatea are alte erori?