Dacă un hard disk a cauzat „erori de magistrală”, ar trebui ca atributele sale SMART să arate probleme?

MWB

29.05.2023, 05:11

Aparatul afișează ocazional „erori de magistrală ATA” și trebuie repornit:

[24028.505239] ata1.00: excepție Emask 0x10 SAct 0x0 SErr 0x48d0002 acțiune 0xe înghețată
[24028.505249] ata1.00: irq_stat 0x08400040, eroare fatală de interfață, starea conexiunii a fost schimbată
[24028.505254] ata1: SError: { RecovComm PHYRdyChg CommWake 10B8B LinkSeq DevExch }
[24028.505258] ata1.00: comandă eșuată: FLUSH CACHE EXT
[24028.505266] ata1.00: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 20
                        res 50/00:18:50:6b:d9/00:00:eb:00:00/40 Emask 0x10 (eroare magistrală ATA)
[24028.505269] ata1.00: stare: { DRDY }
[24028.505276] ata1: hard resetting link
[24032.757212] ata1: conexiune SATA până la 6,0 Gbps (SSstatus 133 SControl 300)
[24032.757615] ata1.00: ambele IDENTIFY au fost anulate, presupunând că NODEV
[24032.757620] ata1.00: revalidarea a eșuat (errno=-2)

Dacă, după repornire, alerg smartctl -t scurt /dev/sda, smartctl -H /dev/sda spune ca a trecut.

Din smartctl -a /dev/sda:

Atribute SMART specifice furnizorului cu praguri:
ID# ATTRIBUTE_NAME VALOAREA STRAPHIEI CEL MAI RĂU TIP DE PRAG ACTUALIZAT WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000b 100 100 016 Pre-eșec Întotdeauna - 0
  2 Throughput_Performance 0x0005 136 136 054 Pre-fail Offline - 80
  3 Spin_Up_Time 0x0007 253 253 024 Pre-fail Always - 176 (Medie 237)
  4 Start_Stop_Count 0x0012 100 100 000 Bătrânețe Întotdeauna - 233
  5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0
  7 Seek_Error_Rate 0x000b 100 100 067 Pre-eșuare Întotdeauna - 0
  8 Seek_Time_Performance 0x0005 124 124 020 Pre-fail Offline - 33
  9 Power_On_Hours 0x0012 091 091 000 Bătrânețea Întotdeauna - 63994
 10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Bătrânețe întotdeauna - 204
192 Power-Off_Retract_Count 0x0032 098 098 000 Bătrânețea Întotdeauna - 2756
193 Load_Cycle_Count 0x0012 098 098 000 Bătrânețea Întotdeauna - 2756
194 Temperature_Celsius 0x0002 142 142 000 Bătrânețe Întotdeauna - 42 (Min/Max 23/52)
196 Reallocated_Event_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 0
197 Current_Pending_Sector 0x0022 100 100 000 Bătrânețe Întotdeauna - 0
198 Offline_Uncorectable 0x0008 100 100 000 Bătrânețe Offline - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Bătrânețe întotdeauna - 0

Versiunea jurnalului de erori SMART: 1
Nu au fost înregistrate erori

Știu că uneori (25% din cazuri) hard disk-urile se defectează brusc și fără a raporta vreodată probleme în SMART. Dar aici, deja văd erori. Faptul că SMART este silentios dovedește că hard disk-ul nu este sursa acestor erori?

Hardware: Placă de bază SuperMicro și un hard disk HGST Deskstar NAS.

0 + 0

linux

pci

software-raid

memorie virtuala

djdomi

29.05.2023, 09:11

pentru mine, unitatea va eșua în timp apropiat

Răspunde

MWB

29.05.2023, 12:04

@djdomi De ce? Dacă erorile provin de la unitatea în sine, SMART nu ar trebui să spună ceva?

Răspunde

Puncte:2

Server

user10489

29.05.2023, 05:41

Există mai multe componente între hard disk și sistemul de operare și oricare dintre ele poate eșua. De obicei, erorile pe care le afișați sunt cauzate de erori de pe hard disk.

Cu toate acestea, lipsa oricăror erori înregistrate în SMART este un semn probabil că hard disk-ul în sine este sănătos. Deci una dintre celelalte componente din lanț poate avea o problemă.

Iată o listă de verificare care poate ajuta:

Asigurați-vă că unitatea este bine așezată și că toate cablurile sunt cuplate complet cu unitatea.
Dacă unitatea este conectată la o placă verticală, asigurați-vă că toate cablurile de pe placa verticală sunt bine așezate.
Asigurați-vă că toate cablurile de date implicate sunt în stare bună, fără tăieturi, îndoituri, răsuciri dure și întinderi
Asigurați-vă că cablurile de date sunt bine așezate în placa de bază sau controlerul de disc
Dacă utilizați un controler de disc suplimentar, asigurați-vă că este bine așezat pe placa de bază
Dacă aveți îndoieli că ceva nu este complet așezat (presupunând că nu este înșurubat și greu de îndepărtat), vă poate ajuta să îl reașezați scoțându-l, verificând priza pentru praf și rebranșând-o, asigurându-vă că este complet. aşezat.

După ce ați verificat toate acestea și eroarea continuă să apară, va trebui efectuată diagnosticare suplimentară pentru a determina care dintre componentele de mai sus nu eșuează. Dacă este posibil, schimbarea locațiilor unităților sau schimbarea cablurilor între placa de bază sau porturile controlerului de disc poate ajuta la izolarea acesteia în continuare. Un controler de disc cu un cip defect poate provoca, de asemenea, probleme de genul acesta, dar poate fi posibil să se diagnosticheze acest lucru doar schimbând cu un alt controler.

De asemenea, poate ajuta să rulați un diagnostic real pe unitate (cu smartctl -t scurt de exemplu și apoi așteptați să se termine și verificați cu smartctl -a pentru a vedea dacă este gata sau are erori), doar pentru a vă asigura că nu este unitatea.

0 + 0

SEF 777

întrebarea această in alte limbi:

EN: If a hard drive caused "bus errors", should its SMART attributes show problems?

TH: หากฮาร์ดไดรฟ์เกิด "ข้อผิดพลาดของบัส" แอตทริบิวต์ SMART ควรแสดงปัญหาหรือไม่

RO: Dacă un hard disk a cauzat „erori de magistrală”, ar trebui ca atributele sale SMART să arate probleme?

RU: Если жесткий диск вызвал «ошибки шины», должны ли его атрибуты SMART показывать проблемы?

VI: Nếu một ổ đĩa cứng gây ra "lỗi xe buýt", các thuộc tính SMART của nó có hiển thị sự cố không?

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.