Am nevoie să-mi testez cardul Dell SAS Controller. Văd prea multe erori la o instalare Raidz2, din iulie anul trecut, decât să fie posibil. E ca și cum o mașină după alta continuă să se învârtească de pe șine.
Am un presupus "dell" 9207-8l. L-am primit de pe ebay în iulie/august 2020. https://www.ebay.com/itm/132663136462
Nu am reușit niciodată să intru în configurația acestuia. Se spune că apăsați Ctrl + C pentru a intra în config. Am încercat crtl stânga și dreapta, plus c, de asemenea, cu C (majusculă) de la capitalul scris. Spune că va intra în configurație după configurare, dar nu o face niciodată, doar merge direct la bios dacă del
a fost presat, sau cizme altfel.
Eu rulez zfs-on-linux, pe rhelx64. Ieri a luat prajitura. A trebuit să scot niște dispozitive de 2TB (6) și să fac până acum 3 LVM-uri de 3TB, pentru a suporta sistemul defect, în timp ce trec printr-un fel de iad RMA.
# stare zpool
piscina: nas
stare: stare DEGRADĂ: Unul sau mai multe dispozitive sunt în prezent în curs de reactivare. Piscina va
continuă să funcționeze, eventual într-o stare degradată.
acțiune: Așteptați până se finalizează reacția de argint.
scanare: resilver în curs de miercuri, 1 decembrie 05:41:15 2021
665G scanat la 24,5 M/s, 640G emis la 23,6 M/s, 9,78 T total
182G resilvered, 6,40% gata, 4 zile 16:52:09 până la final
config:
NUME STAT CITEȘTE SCRIE CKSUM
nas DEGRADAT 0 0 0
raidz2-0 DEGRADAT 0 0 0
scsi-35000c50093a9052f DEGRADAT 0 0 52 prea multe erori
înlocuind-1 DEGRADAT 0 0 52
scsi-35000c50084818db7 OFFLINE 0 0 0
lvzfs2-lvzfsvol2 ONLINE 0 0 0 (resilvering)
scsi-35000c50093a9182b DEGRADAT 235 636 52 prea multe erori
scsi-350000c0f01e5dabc DEGRADAT 0 0 60 prea multe erori
scsi-35000c5008491a803 DEGRADAT 0 0 53 prea multe erori (resilvering)
înlocuind-5 DEGRADAT 0 0 52
scsi-35000c50084889cf3 OFFLINE 0 0 0
lvzfs1-lzfsvol1 ONLINE 0 0 0 (resilvering)
scsi-35000c50093a8dfe7 DEGRADAT 0 0 52 prea multe erori
piese de schimb
lvzfs3-lvzfsvol3 DISPONIBIL
erori: au fost detectate erori permanente în următoarele fișiere:
<metadate>:<0x0>
root@merlin ~$
Această resilvering a avut loc în ultima lună sau două, într-un fel sau altul. Lucrurile arătau de fapt bine pentru perioade scurte, când următoarea unitate a eșuat, sau o unitate eșuată cunoscută anterior (dd dev/zero'd), a eșuat din nou.
Mă înnebunește și mă sperie în același timp, deoarece aceste date sunt cele mai importante. Fotografiile sale de familie din anii 1970 și înainte, etc...
Ajutati-ma va rog?
EDITAȚI | ×: Am adăugat un comentariu cu privire la ceea ce folosesc de fapt unitățile, aici https://www.reddit.com/r/audiophile/comments/bxw38m/bass_vibrations_and_computer_hard_drives/hnvbyj0/ deoarece eram, de asemenea, îngrijorat de faptul că HardHouse și Tidy Tracks dezactivează unitățile cu câteva subwoofere. Se va lua în considerare mutarea serverului în afara biroului, în garaj. De asemenea, am reușit să creez un nou pool zfs, folosind porturile sata și vechile unități de 2Tb și încă nu am probleme. încă în mijlocul iadului de argint, chiar dacă am reglat și chiar am mutat câteva seturi de date în celălalt grup.
root@merlin ~$ stare zpool
bazin: bak
stare: ONLINE
scanare: nu a fost solicitat
config:
NUME STAT CITEȘTE SCRIE CKSUM
bak ONLINE 0 0 0
ata-WDC_WD20EZRX-19D8PB0_WD-WCC4M0428332 ONLINE 0 0 0
ata-WDC_WD2000FYYZ-01UL1B1_WD-WCC1P0891973 ONLINE 0 0 0
erori: nu există erori de date cunoscute
piscina: nas
stare: DEGRADAT
stare: unul sau mai multe dispozitive sunt în curs de reactivare. Piscina va
continuă să funcționeze, eventual într-o stare degradată.
acțiune: Așteptați până se finalizează reacția de argint.
scanare: resilver în desfășurare din Luni Dec 6 11:08:12 2021
7.84T scanat la 37.5M/s, 7.84T emis la 37.5M/s, 9.78T total
3.39T reargintit, 80.16% gata, 0 zile 15:03:25 mai departe
config:
config:
NUME STAT CITEȘTE SCRIE CKSUM
nas DEGRADAT 0 0 0
raidz2-0 DEGRADAT 0 0 0
scsi-35000c50093a9052f DEGRADAT 0 0 0 prea multe erori
înlocuind-1 ONLINE 0 0 0
scsi-35000c50084818db7 ONLINE 0 0 0 (resilvering)
lvzfs2-lvzfsvol2 ONLINE 0 0 0 (resilvering)
înlocuind-2 DEGRADAT 0 0 0
17084797086424522076 UNAVAIL 0 0 0 was /dev/disk/by-id/scsi-35000c50093a9182b-part1
scsi-350000c0f012efb7c ONLINE 0 0 0 (resilvering)
scsi-350000c0f01e5dabc DEGRADAT 0 0 0 prea multe erori (replatizare)
scsi-35000c5008491a803 DEGRADAT 0 0 0 prea multe erori
înlocuind-5 DEGRADAT 0 0 0
scsi-35000c50084889cf3 DEGRADAT 0 0 0 prea multe erori (replatizare)
lvzfs1-lzfsvol1 DEGRADAT 0 0 0 prea multe erori (resilvering)
scsi-35000c50093a8dfe7 DEGRADAT 0 0 0 prea multe erori
erori: 2 erori de date, utilizați „-v” pentru o listă
FYI, au existat erori de sumă de control, dar cele s-au șterse după repornire.
Erorile sunt atât de minime, încât sunt serios impresionat de robustețea ZFS, motiv pentru care îl folosesc în continuare pentru backup-urile mele principale. Mai bine decât să faci copii de rezervă pe un singur disc...
O altă greșeală pe care am făcut-o, am 5 unități noi care stau aici de aproape o săptămână acum, dar nu le pot folosi până când volurile LVM nu termină să se reapară, deoarece sunt atât de aproape de erorile de date, încât vreau să se termine primul, împușcându-mă pe mine însumi. picior pentru că nu am așteptat ca unitățile să sosească prin poștă, înainte de a rula acea operațiune de înlocuire la întâmplare, fără să-mi dau seama că va dura săptămâni pentru a termina toate aceste operațiuni de plata. Nebunie nebună!
Făcusem niște calcule pentru stocarea pe ghețar (0,004/GB), care ar costa 20 USD pe lună pentru 5TB, nu o opțiune. Dacă am avut vreodată nevoie de acele date, uită-le despre costurile de ieșire. De asemenea, îmi place foarte mult acest lucru, folosind ZFS pe un server de acasă pentru asta. Unitățile de matrice anterioare aveau 8 ani, când au fost demontate, și am folosit doar unități cunoscute proaste pe întreaga matrice și am reușit totuși să z2 drumul spre succes. M-am gândit că un set nou de unități recondiționate sau reînnoite ar rezolva această problemă. Îmi pare rău, cred că mă aflu, aș dori să aud mai multe despre ce aș putea face greșit...
Apropo, am făcut ca compania să plătească (deepdiscountserver în acest caz) pentru înlocuirea unităților, diferite modele. nu mai sunt recondiționări IBM pentru mine. voi testa HGST, deoarece acestea au funcționat bine în trecut pentru mine.
Fiți siguri că o nouă cartelă SAS va fi pe drum dacă acestea prezintă probleme, odată ce această nebunie de argint se încheie, dacă se va întâmpla vreodată. Va trebui să fac o altă copie de rezervă completă dacă nu, ceea ce durează aproape atât de mult cât este resilver... Cel puțin am mutat deja datele live din matrice, așa că nu se va produce nicio pierdere decât dacă îmi pierd unitățile principale, pe un alt sistem în tot timpul asta... Presupun că pot spune că datele sunt foarte importante, dar mai am o copie a lor, dar pot suporta o pierdere pentru moment. Clarificând partea „importantă”, va fi URGENT dacă matricea ZFS începe să scoată erori, deoarece nu am decât o singură unitate pe ici pe colo, care conține copiile master.