Ar trebui să monitorizez starea mai multor HDD-uri Seagate ST16000NM002G SAS găzduite pe un server de discuri care rulează CentOS 7. Din câte am înțeles, discurile Seagate nu expun S.M.A.R.T. atribute datorate unei decizii precise de management (vezi această pagină), iar compania sugerează să folosească software-ul SeaTool care, potrivit acestora, este mai fiabil decât S.M.A.R.T. Din păcate, se pare că doar versiunea SSD a SeaTool este disponibilă pentru Linux (vezi această pagină).
Deoarece aș spune că Segate+Linux ar trebui să fie un caz destul de comun în centrele de date moderne, sunt destul de sigur că un instrument de monitorizare de încredere pentru discurile Seagate trebuie să fie disponibil pentru Linux. Poate cineva să ofere o perspectivă, vă rog?
Edit: iată ce primesc cu smartctl pentru discurile Seagate:
$ sudo smartctl -A /dev/sda
smartctl 7.0 2018-12-30 r4883 [x86_64-linux-3.10.0-1160.53.1.el7.x86_64] (build local)
Drepturi de autor (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org
=== ÎNCEPEREA SECȚIUNII DE CITIRE DE DATE INTELIGENTE ===
Temperatura curentă a conducerii: 33 C
Temperatura de călătorie: 60 C
Fabricat în săptămâna 42 a anului 2020
Număr de cicluri specificat pe durata de viață a dispozitivului: 50000
Cicluri pornire-oprire acumulate: 20
Număr specificat de încărcare-descărcare pe durata de viață a dispozitivului: 600000
Cicluri de încărcare-descărcare acumulate: 3324
Elemente din lista de defecte crescute: 0
în timp ce pentru un HDD Toshiba pe o altă mașină:
$ sudo smartctl -A /dev/sdb
smartctl 7.1 2020-04-05 r5049 [x86_64-linux-4.18.0-348.12.2.el8_5.x86_64] (build local)
Drepturi de autor (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org
=== ÎNCEPEREA SECȚIUNII DE CITIRE DE DATE INTELIGENTE ===
Numărul de revizuire al structurii datelor SMART Atribute: 16
Atribute SMART specifice furnizorului cu praguri:
ID# ATTRIBUTE_NAME VALOAREA STRAPHIEI CEL MAI RĂU TIP DE PRAG ACTUALIZAT WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 050 Pre-eșec Întotdeauna - 0
2 Throughput_Performance 0x0005 100 100 050 Pre-fail Offline - 0
3 Spin_Up_Time 0x0027 100 100 001 Pre-fail Always - 7019
4 Start_Stop_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 34
5 Reallocated_Sector_Ct 0x0033 100 100 050 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 100 100 050 Pre-eșec Întotdeauna - 0
8 Seek_Time_Performance 0x0005 100 100 050 Pre-fail Offline - 0
9 Power_On_Hours 0x0032 062 062 000 Bătrânețea Întotdeauna - 15428
10 Spin_Retry_Count 0x0033 100 100 030 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 34
191 G-Sense_Error_Rate 0x0032 100 100 000 Bătrânețe Întotdeauna - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 32
193 Load_Cycle_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 39
194 Temperature_Celsius 0x0022 100 100 000 Bătrânețe Întotdeauna - 31 (Min/Max 15/39)
196 Reallocated_Event_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 0
197 Current_Pending_Sector 0x0032 100 100 000 Bătrânețe Întotdeauna - 0
198 Offline_Uncorectable 0x0030 100 100 000 Bătrânețe Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 253 000 Bătrânețe întotdeauna - 0
220 Disk_Shift 0x0002 100 100 000 Bătrânețe Întotdeauna - 0
222 Loaded_Hours 0x0032 062 062 000 Bătrânețe Întotdeauna - 15427
223 Load_Retry_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 0
224 Load_Friction 0x0022 100 100 000 Bătrânețe Întotdeauna - 0
226 Load-in_Time 0x0026 100 100 000 Bătrânețe Întotdeauna - 648
240 Head_Flying_Hours 0x0001 100 100 001 Pre-fail Offline - 0
M-aș aștepta la ceva de genul acesta din urmă pentru a putea configura o monitorizare adecvată (chiar dacă nu este exactă sau de încredere).