Puncte:0

Cum pot testa cardul meu SAS Controller?

drapel by

Am nevoie să-mi testez cardul Dell SAS Controller. Văd prea multe erori la o instalare Raidz2, din iulie anul trecut, decât să fie posibil. E ca și cum o mașină după alta continuă să se învârtească de pe șine.

Am un presupus "dell" 9207-8l. L-am primit de pe ebay în iulie/august 2020. https://www.ebay.com/itm/132663136462 Nu am reușit niciodată să intru în configurația acestuia. Se spune că apăsați Ctrl + C pentru a intra în config. Am încercat crtl stânga și dreapta, plus c, de asemenea, cu C (majusculă) de la capitalul scris. Spune că va intra în configurație după configurare, dar nu o face niciodată, doar merge direct la bios dacă del a fost presat, sau cizme altfel.

Eu rulez zfs-on-linux, pe rhelx64. Ieri a luat prajitura. A trebuit să scot niște dispozitive de 2TB (6) și să fac până acum 3 LVM-uri de 3TB, pentru a suporta sistemul defect, în timp ce trec printr-un fel de iad RMA.

# stare zpool                                                                               
piscina: nas
stare: stare DEGRADĂ: Unul sau mai multe dispozitive sunt în prezent în curs de reactivare. Piscina va
        continuă să funcționeze, eventual într-o stare degradată.
acțiune: Așteptați până se finalizează reacția de argint.
  scanare: resilver în curs de miercuri, 1 decembrie 05:41:15 2021
        665G scanat la 24,5 M/s, 640G emis la 23,6 M/s, 9,78 T total
        182G resilvered, 6,40% gata, 4 zile 16:52:09 până la final
config:

        NUME STAT CITEȘTE SCRIE CKSUM
        nas DEGRADAT 0 0 0
          raidz2-0 DEGRADAT 0 0 0
            scsi-35000c50093a9052f DEGRADAT 0 0 52 prea multe erori
            înlocuind-1 DEGRADAT 0 0 52
              scsi-35000c50084818db7 OFFLINE 0 0 0
              lvzfs2-lvzfsvol2 ONLINE 0 0 0 (resilvering)
            scsi-35000c50093a9182b DEGRADAT 235 636 52 prea multe erori
            scsi-350000c0f01e5dabc DEGRADAT 0 0 60 prea multe erori
            scsi-35000c5008491a803 DEGRADAT 0 0 53 prea multe erori (resilvering)
            înlocuind-5 DEGRADAT 0 0 52
              scsi-35000c50084889cf3 OFFLINE 0 0 0
              lvzfs1-lzfsvol1 ONLINE 0 0 0 (resilvering)
            scsi-35000c50093a8dfe7 DEGRADAT 0 0 52 prea multe erori
        piese de schimb
          lvzfs3-lvzfsvol3 DISPONIBIL

erori: au fost detectate erori permanente în următoarele fișiere:

        <metadate>:<0x0>
root@merlin ~$

Această resilvering a avut loc în ultima lună sau două, într-un fel sau altul. Lucrurile arătau de fapt bine pentru perioade scurte, când următoarea unitate a eșuat, sau o unitate eșuată cunoscută anterior (dd dev/zero'd), a eșuat din nou.

Mă înnebunește și mă sperie în același timp, deoarece aceste date sunt cele mai importante. Fotografiile sale de familie din anii 1970 și înainte, etc...

Ajutati-ma va rog?

EDITAȚI | ×: Am adăugat un comentariu cu privire la ceea ce folosesc de fapt unitățile, aici https://www.reddit.com/r/audiophile/comments/bxw38m/bass_vibrations_and_computer_hard_drives/hnvbyj0/ deoarece eram, de asemenea, îngrijorat de faptul că HardHouse și Tidy Tracks dezactivează unitățile cu câteva subwoofere. Se va lua în considerare mutarea serverului în afara biroului, în garaj. De asemenea, am reușit să creez un nou pool zfs, folosind porturile sata și vechile unități de 2Tb și încă nu am probleme. încă în mijlocul iadului de argint, chiar dacă am reglat și chiar am mutat câteva seturi de date în celălalt grup.

root@merlin ~$ stare zpool
  bazin: bak
 stare: ONLINE
  scanare: nu a fost solicitat
config:

        NUME STAT CITEȘTE SCRIE CKSUM
        bak ONLINE 0 0 0
          ata-WDC_WD20EZRX-19D8PB0_WD-WCC4M0428332 ONLINE 0 0 0
          ata-WDC_WD2000FYYZ-01UL1B1_WD-WCC1P0891973 ONLINE 0 0 0

erori: nu există erori de date cunoscute

  piscina: nas
 stare: DEGRADAT
stare: unul sau mai multe dispozitive sunt în curs de reactivare. Piscina va
        continuă să funcționeze, eventual într-o stare degradată.
acțiune: Așteptați până se finalizează reacția de argint.
  scanare: resilver în desfășurare din Luni Dec 6 11:08:12 2021
        7.84T scanat la 37.5M/s, 7.84T emis la 37.5M/s, 9.78T total
        3.39T reargintit, 80.16% gata, 0 zile 15:03:25 mai departe
config:

config:

        NUME STAT CITEȘTE SCRIE CKSUM
        nas DEGRADAT 0 0 0
          raidz2-0 DEGRADAT 0 0 0
            scsi-35000c50093a9052f DEGRADAT 0 0 0 prea multe erori
            înlocuind-1 ONLINE 0 0 0
              scsi-35000c50084818db7 ONLINE 0 0 0 (resilvering)
              lvzfs2-lvzfsvol2 ONLINE 0 0 0 (resilvering)
            înlocuind-2 DEGRADAT 0 0 0
              17084797086424522076 UNAVAIL 0 0 0 was /dev/disk/by-id/scsi-35000c50093a9182b-part1
              scsi-350000c0f012efb7c ONLINE 0 0 0 (resilvering)
            scsi-350000c0f01e5dabc DEGRADAT 0 0 0 prea multe erori (replatizare)
            scsi-35000c5008491a803 DEGRADAT 0 0 0 prea multe erori
            înlocuind-5 DEGRADAT 0 0 0
              scsi-35000c50084889cf3 DEGRADAT 0 0 0 prea multe erori (replatizare)
              lvzfs1-lzfsvol1 DEGRADAT 0 0 0 prea multe erori (resilvering)
            scsi-35000c50093a8dfe7 DEGRADAT 0 0 0 prea multe erori

erori: 2 erori de date, utilizați „-v” pentru o listă

FYI, au existat erori de sumă de control, dar cele s-au șterse după repornire.

Erorile sunt atât de minime, încât sunt serios impresionat de robustețea ZFS, motiv pentru care îl folosesc în continuare pentru backup-urile mele principale. Mai bine decât să faci copii de rezervă pe un singur disc...

O altă greșeală pe care am făcut-o, am 5 unități noi care stau aici de aproape o săptămână acum, dar nu le pot folosi până când volurile LVM nu termină să se reapară, deoarece sunt atât de aproape de erorile de date, încât vreau să se termine primul, împușcându-mă pe mine însumi. picior pentru că nu am așteptat ca unitățile să sosească prin poștă, înainte de a rula acea operațiune de înlocuire la întâmplare, fără să-mi dau seama că va dura săptămâni pentru a termina toate aceste operațiuni de plata. Nebunie nebună!

Făcusem niște calcule pentru stocarea pe ghețar (0,004/GB), care ar costa 20 USD pe lună pentru 5TB, nu o opțiune. Dacă am avut vreodată nevoie de acele date, uită-le despre costurile de ieșire. De asemenea, îmi place foarte mult acest lucru, folosind ZFS pe un server de acasă pentru asta. Unitățile de matrice anterioare aveau 8 ani, când au fost demontate, și am folosit doar unități cunoscute proaste pe întreaga matrice și am reușit totuși să z2 drumul spre succes. M-am gândit că un set nou de unități recondiționate sau reînnoite ar rezolva această problemă. Îmi pare rău, cred că mă aflu, aș dori să aud mai multe despre ce aș putea face greșit...

Apropo, am făcut ca compania să plătească (deepdiscountserver în acest caz) pentru înlocuirea unităților, diferite modele. nu mai sunt recondiționări IBM pentru mine. voi testa HGST, deoarece acestea au funcționat bine în trecut pentru mine.

Fiți siguri că o nouă cartelă SAS va fi pe drum dacă acestea prezintă probleme, odată ce această nebunie de argint se încheie, dacă se va întâmpla vreodată. Va trebui să fac o altă copie de rezervă completă dacă nu, ceea ce durează aproape atât de mult cât este resilver... Cel puțin am mutat deja datele live din matrice, așa că nu se va produce nicio pierdere decât dacă îmi pierd unitățile principale, pe un alt sistem în tot timpul asta... Presupun că pot spune că datele sunt foarte importante, dar mai am o copie a lor, dar pot suporta o pierdere pentru moment. Clarificând partea „importantă”, va fi URGENT dacă matricea ZFS începe să scoată erori, deoarece nu am decât o singură unitate pe ici pe colo, care conține copiile master.

Puncte:3
drapel cn

Am nevoie să-mi testez cardul Dell SAS Controller.

Simplu. Înlocuiți cu altul. Atunci știi dacă cardul are sau nu probleme.

Niciunul disponibil? Putem reveni la „profesionalism” și „cele mai bune practici” în regulile site-ului? Cereți unei companii să o facă (și să plătească). Testarea de înlocuire este aproape singura (și cu siguranță cea mai eficientă) modalitate de a vă asigura că nu este o piesă defectuoasă.

deoarece aceste date sunt cele mai importante. Fotografiile sale de familie din anii 1970 și inainte, etc...

Pe lângă faptul că acest lucru este în afara subiectului aici...

...NU ESTE DELOC IMPORTANT PENTRU VOI. Eu merg prin „pune bani unde e gura”. Dacă acest lucru AR fi important pentru dvs., ar fi susținut. Adică, am învățat la școală - acum mai bine de 30 de ani - că backup-urile sunt o idee și o necesitate. Așadar, nu veni cu „important” când la final refuzi să faci ceea ce fac oamenii cu date importante. Începeți să implementați o copie de rezervă - o mulțime de servicii destul de ieftine în jur.

Brian Thomas avatar
drapel by
mulțumesc, înlocuirea nu este în întregime utilă, am considerat deja că, soția este deja de Crăciun, vorbeam despre pierderea de date aici.. Uneori pur și simplu nu-ți poți permite lucruri dacă știi ce vreau să spun.. Apropo, la copiile tale de rezervă, aceasta este o copie de rezervă!! Joc devreme, nu vreau să-mi pierd datele principale (pe o singură unitate), în același timp, repar matricea. Mereu mă uimește când cineva spune să arunci bani în el. deja luat in considerare, crede-ma... Apreciez sfatul ca nu exista alta cale decat sa-l inlocuiesti, dar chiar? Va trebui să dau peste cap... ah...
drapel cn
„Mulțumesc, înlocuirea nu este în întregime utilă” - da, ok. Deci, în lumea voastră, ar fi util să obțineți o schemă și un laborator de electronică și să testați fiecare conexiune de lipire ȘI să rulați echipamente de testare logică pe toate cipurile? Calea profesională (necesară de regulile site-ului, indiferent dacă vă ajută sau nu) este cea eficientă: înlocuiți, verificați, apoi ȘTIȚI unde să căutați. Și este MULT mai ieftin decât să faci un test real zile întregi cu un laborator - atunci doar să realizezi că un cablu este o prostie. Sau sursa ta de alimentare. Acest lucru nu înseamnă nici măcar să aruncați bani în el - important, aveți pregătit înlocuirea.
drapel cn
Dacă acesta este backupul dvs., obțineți o verificare a realității și începeți să utilizați serviciile de backup. AWS, Azure, Backblaze au servicii destul de bune, care sunt MULT mai garantate decât un raid bazat pe SAS de gamă redusă.
Brian Thomas avatar
drapel by
plătiți în schimb un abonament lunar? psshhh. Partajați-l cu date mari? psshhh.. Sunt deja în domeniul SRE. Vă prezint, ZFS pe serverul de acasă ca rezervă... Sunt destul de convins că acum cardul este, deoarece acum aproape toate unitățile arată prost. Mă duc să-l reașez. Nici eu nu vorbeam despre o testare de laborator, am întrebat dacă există alte modalități bazate pe software de a o testa, de care s-ar putea să nu cunosc.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.