Astăzi, serverul meu de acasă a intrat în panică kernel, ceva a mers prost cu unitatea de sistem. Am schimbat unitatea, am restaurat serverul și acum încerc să-mi dau seama ce s-a întâmplat cu cel vechi. De fapt este destul de vechi, deci cred că va fi un eșec hw, totuși aș vrea să încerc să învăț ceva despre tehnicile de recuperare (și să aflu de ce SMART nu m-a avertizat). Acum pot vedea unitatea ca /dev/sdb și pot detecta lvm acolo, așa că am redenumit ubuntu-vg în ubuntu-vg-old și l-am activat.
root@calcium:~# lvs
LV VG Attr LSize Pool Origin Data% Meta% Move Log Cpy%Sync Convert
ubuntu-lv ubuntu-vg -wi-ao---- <29,06 g
copii de rezervă ubuntu-vg-old -wi-a----- 1.29t
ubuntu-lv ubuntu-vg-old -wi-a----- 200,00 g
Din păcate, montarea nu funcționează și după o perioadă lungă de timp, comanda eșuează, făcând unitatea inaccesibilă:
root@calcium:~# mount /dev/ubuntu-vg-old/ubuntu-lv /mnt -o ro,user
mount: /mnt: nu pot citi superblock pe /dev/mapper/ubuntu--vg--old-ubuntu--lv.
root@calcium:~# pvscan
Eroare la citirea dispozitivului /dev/sdb la lungimea 0 512.
Eroare la citirea dispozitivului /dev/sdb la lungimea 0 4096.
Eroare la citirea dispozitivului /dev/sdb1 la lungimea 0 4096.
Eroare la citirea dispozitivului /dev/sdb2 la lungimea 0 4096.
Eroare la citirea dispozitivului /dev/sdb3 la lungimea 0 4096.
PV /dev/sda3 VG ubuntu-vg lvm2 [58,12 GiB / 29,06 GiB gratuit]
Total: 1 [58,12 GiB] / în uz: 1 [58,12 GiB] / fără VG: 0 [0 ]
După repornire (nu am găsit altă modalitate de a-l face din nou accesibil) unitatea este înapoi. Am incercat sa o repar:
root@calcium:~# fsck /dev/mapper/ubuntu--vg--old-ubuntu--lv
fsck de la util-linux 2.36.1
e2fsck 1.46.3 (27-iul-2021)
/dev/mapper/ubuntu--vg--old-ubuntu--lv: jurnal de recuperare
fsck.ext4: Eroare de intrare/ieșire în timpul încercării de a redeschide /dev/mapper/ubuntu--vg--old-ubuntu--lv
/dev/mapper/ubuntu--vg--old-ubuntu--lv: ********** AVERTISMENT: Sistemul de fișiere are încă erori **********
Dar acest lucru se comportă exact la fel ca montare, timeout lung și unitatea este abandonată din sistem. Am rulat testul de suprafață offline SMART peste noapte (smartctl -t offline /dev/sdb
), nu a găsit probleme și nu a schimbat niciun atribut SMART offline. Testul de citire badblocks funcționează, de asemenea, bine, fără erori:
root@calcium:~# badblocks -b 4096 -c 1024 -s -o bb.out /dev/sdb
Verificarea blocurilor proaste (test numai în citire): terminat
Așa că am încercat un test nedistructiv de citire-scriere cu badblocks (badblocks -b 4096 -c 1024 -s -n -v /dev/sdb
) și unitatea scade din nou din sistem după aproximativ o jumătate de oră de funcționare. Am înlocuit deja cablul SATA și am conectat unitatea la un alt port. Există clar o problemă doar când scris către anumite sectoare.
Mai există ceva pe care aș putea încerca înainte de formatarea completă (care, cel mai probabil, va eșua, cred)?
Date inteligente:
=== ÎNCEPEREA SECȚIUNII DE CITIRE DE DATE INTELIGENTE ===
Rezultatul testului de autoevaluare a sănătății generale SMART: A TRUS
Numărul de revizuire al structurii datelor SMART Atribute: 16
Atribute SMART specifice furnizorului cu praguri:
ID# ATTRIBUTE_NAME VALOAREA STRAPHIEI CEL MAI RĂU TIP DE PRAG ACTUALIZAT WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-eșec întotdeauna - 414
2 Throughput_Performance 0x0026 055 051 000 Bătrânețea Întotdeauna - 18840
3 Spin_Up_Time 0x0023 077 066 025 Pre-fail Always - 7179
4 Start_Stop_Count 0x0032 094 094 000 Bătrânețea Întotdeauna - 6274
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 252 252 051 Bătrânețea Întotdeauna - 0
8 Seek_Time_Performance 0x0024 252 252 015 Bătrânețe Offline - 0
9 Power_On_Hours 0x0032 100 100 000 Bătrânețe Întotdeauna - 31668
10 Spin_Retry_Count 0x0032 252 252 051 Bătrânețe Întotdeauna - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 2
12 Power_Cycle_Count 0x0032 098 098 000 Bătrânețea Întotdeauna - 2286
181 Program_Fail_Cnt_Total 0x0022 100 100 000 Bătrânețe Întotdeauna - 19262840
191 G-Sense_Error_Rate 0x0022 099 099 000 Bătrânețea Întotdeauna - 11132
192 Power-Off_Retract_Count 0x0022 252 252 000 Bătrânețe Întotdeauna - 0
194 Temperature_Celsius 0x0002 064 044 000 Bătrânețe Întotdeauna - 35 (Min/Max 14/56)
195 Hardware_ECC_Recovered 0x003a 100 100 000 Bătrânețe Întotdeauna - 0
196 Reallocated_Event_Count 0x0032 252 252 000 Bătrânețea Întotdeauna - 0
197 Current_Pending_Sector 0x0032 087 083 000 Bătrânețe Întotdeauna - 1617
198 Offline_Uncorectable 0x0030 252 084 000 Bătrânețe Offline - 0
199 UDMA_CRC_Error_Count 0x0036 200 200 000 Bătrânețe întotdeauna - 0
200 Multi_Zone_Error_Rate 0x002a 100 100 000 Bătrânețe întotdeauna - 235
223 Load_Retry_Count 0x0032 100 100 000 Bătrânețe Întotdeauna - 2
225 Load_Cycle_Count 0x0032 100 100 000 Bătrânețe întotdeauna - 6320
Versiunea jurnalului de erori SMART: 1
Nu au fost înregistrate erori
Structura jurnalului de autotestare SMART numărul de revizuire 1
Num Test_Description Stare Durată de viață rămasă (ore) LBA_of_first_error
# 1 Scurt offline Finalizat fără eroare 00% 31656 -
# 2 Scurt offline Finalizat fără eroare 00% 31632 -
# 3 Scurt offline Finalizat: eșec de citire 10% 31608 2541336840
# 4 Extins offline Finalizat fără eroare 00% 31587 -
# 5 Scurt offline Finalizat fără eroare 00% 31560 -
# 6 Scurt offline Finalizat fără eroare 00% 31536 -
# 7 Scurt offline Finalizat fără eroare 00% 31512 -
# 8 Scurt offline Finalizat fără eroare 00% 31488 -
# 9 Scurt offline Finalizat fără eroare 00% 31464 -
#10 Scurt offline Finalizat fără eroare 00% 31440 -
#11 Extins offline Finalizat fără eroare 00% 31419 -
#12 Scurt offline Finalizat fără eroare 00% 31392 -
#13 Scurt offline Finalizat fără eroare 00% 31368 -
#14 Scurt offline Finalizat fără eroare 00% 31344 -
#15 Scurt offline Finalizat fără eroare 00% 31320 -
#16 Scurt offline Finalizat fără eroare 00% 31296 -
#17 Scurt offline Finalizat fără eroare 00% 31272 -
#18 Extins offline Finalizat fără eroare 00% 31251 -
#19 Scurt offline Finalizat fără eroare 00% 31224 -
#20 Scurt offline Finalizat fără eroare 00% 31200 -
#21 Scurt offline Finalizat fără eroare 00% 31176 -