Puncte:1

Teste de sănătate pe NVMe

drapel us

Pe serverele pe care le am, cu HDD sau SSD, am un cron care ruleaza periodic:

/usr/sbin/smartctl --test=short/long /dev/sd1

(pentru fiecare disc)

În timp ce rulează, se uită doar la ieșirea lui /usr/sbin/smartctl -c /dev/sd1, buclă până când nu mai conține:

[0-9]+% din test rămas.

Și apoi verifică dacă s-a finalizat fără erori:

( 0) Rutina anterioară de autotestare a fost finalizată

Cu toate acestea, se pare că smartctl nu acceptă încă testarea NVMe, începând cu versiunea 7.0 și conform: https://www.smartmontools.org/wiki/NVMe_Support

Se spune că

Daemonul smartd urmărește starea de sănătate (-H), numărul de erori (eroare -l) și temperatura (-W DIFF,INFO,CRIT)

dar ce face de fapt testele? Nu sunt sigur dacă ieșirea de -H și -l actualizați dacă nu rulăm teste scurte/lungi?

Am citit si despre nvme-cli, dar se pare că nu găsesc modalități de a rula teste de sănătate pe discuri cu el.

Vreo idee?

Folosind CentOS 7 aici.

Marcus Müller avatar
drapel pt
Nu *știu*, dar aș fi surprins dacă rularea oricărui test explicit ar avea un avantaj foarte mare de cunoștințe pentru SSD-uri â aceste lucruri sunt într-o poziție perfectă pentru a-și urmări propria sănătate, deoarece nivelarea uzurii știe literalmente cât de des fiecare segment de memorie a fost utilizat, *și* datorită codului cuprinzător de corectare a erorilor inerent dispozitivelor NVMe, obțineți o imagine foarte bună a îmbătrânirii dispozitivului pur și simplu de la utilizarea de zi cu zi.
Puncte:1
drapel ca

Autotestarea SMART au fost concepute pentru discuri mecanice. SSD-urile SATA oglindesc aproape complet comportamentul anterior la nivel de interfață HDD, care acceptă astfel de autotestare, dar nu fac prea mult atunci când îl rulați, de fapt. Unitățile NVMe au renunțat complet la astfel de rutine de autotestare SMART.

Pentru discurile bazate pe flash, ar trebui să urmăriți cu adevărat uzura celulelor, numărul de blocuri de rezervă și sectoarele realocate, mai degrabă decât să se bazeze pe vechile rutine de autotestare care nu sunt acceptate pe unitățile NVMe.

Nuno avatar
drapel us
Mulțumesc foarte mult. Are sens. Știți că dacă las `smartd` să ruleze, mă va anunța despre orice probleme cu discul NVMe prin mesajele syslog? Tot ce vreau este să fiu sigur că sunt acoperit și nu neglijent :-)
shodanshok avatar
drapel ca
Din câte știu, `smartd` ar trebui să fie capabil să monitorizeze sănătatea SSD-ului NVMe, de asemenea, pentru a alerta în cazul în care unitatea în sine raportează o stare nesănătoasă.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.