După ce am observat întârzieri anormal de lungi în operațiunile de disc, am căutat journalctl și iată ce am găsit:
22 februarie 14:02:11.711182 Onan01 kernel: ata10: hard resetting link
22 februarie 14:02:12.186958 Onan01 kernel: ata10: SATA link up 1,5 Gbps (SSstatus 113 SControl 310)
22 februarie 14:02:12.187044 kernel Onan01: ata10.00: configurat pentru UDMA/33
22 februarie 14:02:12.187068 Onan01 kernel: ata10: EH complet
22 februarie 14:02:22.782960 Nucleu Onan01: ata10: conexiune SATA de 1,5 Gbps (SSstatus 113 SControl 310)
22 februarie 14:02:22.783033 Nucleu Onan01: ata10.00: configurat pentru UDMA/33
22 februarie 14:03:27.472083 Onan01 kernel: ata10.00: excepție Emask 0x0 SAct 0x0 SErr 0xd0000 acțiune 0x6 înghețată
22 februarie 14:03:27.472241 Onan01 kernel: ata10: SError: { PHYRdyChg CommWake 10B8B }
22 februarie 14:03:27.472271 Onan01 kernel: ata10.00: comandă eșuată: WRITE DMA EXT
22 februarie 14:03:27.472300 Onan01 kernel: ata10.00: cmd 35/00:18:00:35:44/00:00:74:00:00/e0 tag 14 dma 12288 out
res 40/00:01:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
22 februarie 14:03:27.472323 Onan01 kernel: ata10.00: stare: { DRDY }
22 februarie 14:03:27.472345 Onan01 kernel: ata10: hard resetting link
22 februarie 14:03:27.950979 Nucleu Onan01: ata10: conexiune SATA de 1,5 Gbps (SSstatus 113 SControl 310)
22 februarie 14:03:27.951084 Nucleu Onan01: ata10.00: configurat pentru UDMA/33
22 februarie 14:03:27.951113 Onan01 kernel: ata10: EH complet
22 februarie 14:04:03.852081 Onan01 kernel: ata10.00: excepție Emask 0x10 SAct 0x0 SErr 0x40d0000 acțiune 0xe înghețată
22 februarie 14:04:03.852242 Onan01 kernel: ata10.00: irq_stat 0x00000040, starea conexiunii a fost schimbată
22 februarie 14:04:03.852274 Onan01 kernel: ata10: SError: { PHYRdyChg CommWake 10B8B DevExch }
22 februarie 14:04:03.852301 Onan01 kernel: ata10.00: comandă eșuată: WRITE DMA EXT
22 februarie 14:04:03.852325 Onan01 kernel: ata10.00: cmd 35/00:38:58:35:44/00:00:74:00:00/e0 tag 17 dma 28672 out
res 50/00:00:38:23:00/00:00:ac:00:00/e0 Emask 0x10 (eroare magistrală ATA)
22 februarie 14:04:03.852357 Onan01 kernel: ata10.00: stare: { DRDY }
Primul tip de eroare (timeout) pare mai frecventă decât al doilea (eroare magistrală ATA). Există un număr destul de mare din fiecare. Canalul SATA ata10
este conectat la un HDD WD Caviar Green.
Diagnosticarea SMART de pe acest disc este aparent curată:
sudo smartctl --all /dev/sdf1
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-100-generic] (build local)
Drepturi de autor (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org
=== ÎNCEPE SECȚIUNEA DE INFORMAȚII ===
Model de dispozitiv: WDC WD20EZAZ-00GGJB0
Număr de serie: WD-WXT1A29LE265
ID dispozitiv LU WWN: 5 0014ee 211b07a4f
Versiune de firmware: 80.00A80
Capacitate utilizator: 2.000.398.934.016 octeți [2,00 TB]
Dimensiuni sector: 512 octeți logic, 4096 octeți fizic
Rata de rotatie: 5400 rpm
Factor de formă: 3,5 inchi
Dispozitivul este: Nu în baza de date smartctl [pentru detalii utilizați: -P showall]
Versiunea ATA este: ACS-3 T13/2161-D revizuirea 5
Versiunea SATA este: SATA 3.1, 6.0 Gb/s (actual: 6.0 Gb/s)
Ora locală este: miercuri 23 februarie 11:37:14 2022 IST
Suportul SMART este: Disponibil - dispozitivul are capacitate SMART.
Suportul SMART este: Activat
=== ÎNCEPEREA SECȚIUNII DE CITIRE DE DATE INTELIGENTE ===
Rezultatul testului de autoevaluare a sănătății generale SMART: A TRUS
Valori generale SMART:
Starea de colectare a datelor offline: (0x00) Activitate de colectare a datelor offline
nu a fost niciodată începută.
Colectare automată de date offline: dezactivată.
Starea execuției autotestării: ( 0) Rutina anterioară de autotestare a fost finalizată
fără eroare sau nici un autotest nu a avut vreodată
fost condus.
Timp total până la finalizarea Offline
colectarea datelor: (32520) secunde.
Colectarea datelor offline
capabilități: (0x7b) SMART execută Offline imediat.
Suport activat/dezactivat pentru colectarea datelor offline automat.
Suspendați colecția offline la nou
comanda.
Scanarea suprafeței offline este acceptată.
Autotest acceptat.
Autotestare a transportului acceptat.
Autotest selectiv acceptat.
Capacitățile SMART: (0x0003) Salvează datele SMART înainte de a le introduce
Modul de economisire a energiei.
Suportă temporizator SMART de salvare automată.
Capacitatea de înregistrare a erorilor: (0x01) Înregistrarea erorilor este acceptată.
Înregistrare cu scop general acceptat.
Scurtă rutină de autotestare
timpul recomandat de votare: (2) minute.
Rutină extinsă de autotestare
timpul recomandat de votare: ( 103) minute.
Rutina de autotestare a transportului
timpul recomandat de votare: (2) minute.
Capacități SCT: (0x3035) Stare SCT acceptată.
SCT Feature Control acceptat.
Tabel de date SCT acceptat.
Numărul de revizuire al structurii datelor SMART Atribute: 16
Atribute SMART specifice furnizorului cu praguri:
ID# ATTRIBUTE_NAME VALOAREA STRAPHIEI CEL MAI RĂU TIP DE PRAG ACTUALIZAT WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-eșec Întotdeauna - 0
3 Spin_Up_Time 0x0027 184 170 021 Pre-fail Always - 1783
4 Start_Stop_Count 0x0032 099 099 000 Bătrânețea Întotdeauna - 1573
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Bătrânețe Întotdeauna - 0
9 Power_On_Hours 0x0032 083 083 000 Bătrânețea Întotdeauna - 13100
10 Spin_Retry_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 0
12 Power_Cycle_Count 0x0032 099 099 000 Bătrânețea Întotdeauna - 1524
192 Power-Off_Retract_Count 0x0032 199 199 000 Bătrânețe_Întotdeauna - 761
193 Load_Cycle_Count 0x0032 147 147 000 Bătrânețe întotdeauna - 160779
194 Temperature_Celsius 0x0022 115 104 000 Bătrânețe Întotdeauna - 28
196 Reallocated_Event_Count 0x0032 200 200 000 Bătrânețe Întotdeauna - 0
197 Current_Pending_Sector 0x0032 200 200 000 Bătrânețe Întotdeauna - 0
198 Offline_Uncorectable 0x0030 100 253 000 Bătrânețe Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Bătrânețe întotdeauna - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Bătrânețe Offline - 0
Versiunea jurnalului de erori SMART: 1
Nu au fost înregistrate erori
Structura jurnalului de autotestare SMART numărul de revizuire 1
Num Test_Description Stare Durată de viață rămasă (ore) LBA_of_first_error
# 1 Scurt offline Finalizat fără eroare 00% 13100 -
# 2 Scurt offline Finalizat fără eroare 00% 13099 -
Structura datelor jurnalului de autotestare selectivă SMART numărul de revizuire 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Ne_testare
2 0 0 Ne_testare
3 0 0 Ne_testare
4 0 0 Ne_testare
5 0 0 Ne_testare
Indicatori selectivi de autotestare (0x0):
După scanarea intervalelor selectate, NU citiți și scanați restul discului.
Dacă autotestarea selectivă este în așteptare la pornire, reluați după o întârziere de 0 minute.
Un lucru ciudat, totuși, testele SMART lungi nu par să funcționeze corect. Trec de la progres 90% la terminat direct (fără 80%, 70% etc.) și, ulterior, nu apar în secțiunea „Jurnal de autotestare SMART”.
Am experimentat întârzieri în operațiunile cu fișierele de două zile la rând. După repornire, problema pare să dispară și apoi revine. Mai exact, problemele iau forma unor întârzieri mari în copierea sau mutarea fișierelor și în LibreOffice agățat de salvarea unui fișier. Ai idee care ar putea fi cauza unor astfel de erori?
OS: Ubuntu 20.04
Procesor: Ryzen 3
MB: Gigabyte X570 UD