Puncte:0

FAILED md RAID10, ieșire confuză

drapel in

Testez o matrice RAID10 aici cu mdadm. Am vrut să văd câte dispozitive eșuate ar putea tolera, timpi de reconstrucție etc. La un moment dat l-am făcut o resincronizare pe 5 sau 6 dispozitive, apoi l-am repornit, acum arată inactiv și nu sunt sigur ce este face sau cum să-l recuperez.

Nu este nimic important acolo și l-aș putea recrea, dar aș prefera să îmi dau seama ce a mers prost și dacă poate fi recuperat.

root@netcu1257-vs-02:~# cat /proc/mdstat Personalități : [liniar] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 : inactiv sdz[19] sdy[ 18] sdx[17] sdw[16] sdv[15] sdu[14] sds[12] sdt[13] sdr[11] sdq[10](S) sdp[21] sdn[8] sdm[7] sdo [9] sdl[6] sdj[20](R) sdk[22](S) sdi[4](S) sdh[3] sdf[1] sde[0] sdg[2]
              257812572160 blocuri super 1.2
        root@netcu1257-vs-02:~# mdadm -D /dev/md0
        /dev/md0:
                   Versiune: 1.2
             Ora creării: vineri, 29 octombrie 13:59:41 2021
                Nivel raid: raid10
             Dimensiune Dev folosită: 18446744073709551615
              Dispozitive raid: 20
             Total dispozitive: 22
               Persistență: Superblocul este persistent
    
           Ora actualizării: Luni, 8 noiembrie 09:59:42 2021
                 Stare: activ, FAILED, Not Started 
        Dispozitive active: 13
       Dispozitive de lucru: 22
        Dispozitive eșuate: 0
         Dispozitive de rezervă: 9
    
                Aspect: aproape=2
            Dimensiune bucată: 512K
    
    Politica de coerență: necunoscută
    
                  Nume: netcu1257-vs-02:0 (local pentru gazda netcu1257-vs-02)
                  UUID: c3418360:4fb5857c:eb952018:163a60c6
                Evenimente: 85985
    
        Număr Major Minor Raid Starea dispozitivului
           - 0 0 0 eliminat
           - 0 0 1 eliminat
           - 0 0 2 eliminat
           - 0 0 3 eliminat
           - 0 0 4 eliminat
           - 0 0 5 eliminat
           - 0 0 6 eliminat
           - 0 0 7 eliminat
           - 0 0 8 eliminat
           - 0 0 9 eliminat
           - 0 0 10 eliminat
           - 0 0 11 eliminat
           - 0 0 12 eliminat
           - 0 0 13 eliminat
           - 0 0 14 eliminat
           - 0 0 15 eliminat
           - 0 0 16 eliminat
           - 0 0 17 eliminat
           - 0 0 18 eliminat
           - 0 0 19 eliminat
    
           - 65 112 17 sincronizare set-B /dev/sdx
           - 8 64 0 reconstrucție de rezervă /dev/sde
           - 8 208 8 sincronizare set-A /dev/sdn
           - 65 80 15 sincronizare set-B /dev/sdv
           - 8 176 6 sincronizare set-A /dev/sdl
           - 65 48 13 sincronizare set-B /dev/sdt
           - 8 144 5 reconstrucție de rezervă /dev/sdj
           - 65 16 11 set sincronizare-B /dev/sdr
           - 8 112 3 sincronizare set-B /dev/sdh
           - 8 240 7 reconstrucție de rezervă /dev/sdp
           - 65 128 18 sincronizare set-A /dev/sdy
           - 8 80 1 set de sincronizare-B /dev/sdf
           - 8 224 9 reconstrucție de rezervă /dev/sdo
           - 65 96 16 sincronizare set-A /dev/sdw
           - 8 192 10 reconstrucție de rezervă /dev/sdm
           - 65 64 14 sync set-A /dev/sdu
           - 8 160 - de rezervă /dev/sdk
           - 65 32 12 sincronizare set-A /dev/sds
           - 8 128 - de rezervă /dev/sdi
           - 65 0 - rezervă /dev/sdq
           - 65 144 19 set de sincronizare-B /dev/sdz
           - 8 96 2 reconstrucție de rezervă /dev/sdg

După cum puteți vedea, toate dispozitivele mele (/dev/sd[e-z]) apar ca parte a md0, dar arată și 20 de dispozitive lipsă. Formatul original al matricei era de 20 de dispozitive cu 2 de rezervă. Și în timp ce spune că se reconstruiește, nu există nicio activitate pe disc, iar /proc/mdstat indică același lucru.

Acesta este recuperabil? Și având în vedere că matricea se reconstruia înainte ca gazda să fie repornită, ce aș fi putut face pentru a mă asigura că reconstrucția ar fi continuat și matricea ar fi rămas activă după o repornire?

Editați | ×:

Am descoperit că fișierul meu mdadm.conf a fost plasat incorect în /etc/. L-am mutat în /etc/mdadm/ și am repornit, acum matricea mea este afișată ca RAID0, încă inactiv:

root@netcu1257-vs-02:~# mdadm -D /dev/md0
/dev/md0:
           Versiune: 1.2
        Nivel raid: raid0
     Total dispozitive: 22
       Persistență: Superblocul este persistent

             Stare: inactiv
   Dispozitive de lucru: 22

              Nume: netcu1257-vs-02:0 (local pentru gazda netcu1257-vs-02)
              UUID: c3418360:4fb5857c:eb952018:163a60c6
            Evenimente: 85985

    Număr Major Minor RaidDevice

       - 65 112 - /dev/sdx
       - 8 64 - /dev/sde
       - 8 208 - /dev/sdn
       - 65 80 - /dev/sdv
       - 8 176 - /dev/sdl
       - 65 48 - /dev/sdt
       - 8 144 - /dev/sdj
       - 65 16 - /dev/sdr
       - 8 112 - /dev/sdh
       - 8 240 - /dev/sdp
       - 65 128 - /dev/sdy
       - 8 80 - /dev/sdf
       - 8 224 - /dev/sdo
       - 65 96 - /dev/sdw
       - 8 192 - /dev/sdm
       - 65 64 - /dev/sdu
       - 8 160 - /dev/sdk
       - 65 32 - /dev/sds
       - 8 128 - /dev/sdi
       - 65 0 - /dev/sdq
       - 65 144 - /dev/sdz
       - 8 96 - /dev/sdg
Nikita Kipriyanov avatar
drapel za
Mă îndoiesc că acest lucru ar trebui să fie pe ServerFault. Acest site este despre probleme de afaceri, nu despre experimente curioase cu Linux. Aș muta asta în Unix&Linux.
drapel in
De ce presupuneți că acest lucru nu este pentru utilizare într-o afacere? În ce afacere sunteți implicat care nu își testează tehnologia înainte de a o pune în producție?
Puncte:0

Trebuie să adăugați din nou toate unitățile.

Pentru toți din set-A. atunci la fel pentru set-B

mdadm --manage /dev/mdN -a /dev/sdX1

Înainte de asta, încearcă un simplu

mdadm --assemble /dev/mdN /dev/sd? ...
Ярослав Рахматуллин avatar
https://www.thomas-krenn.com/en/wiki/Mdadm_recovery_and_resync
Nikita Kipriyanov avatar
drapel za
Probabil că vor vedea că mesajul despre dispozitivul este ocupat dacă încearcă să urmeze sfatul tău. Pentru că dispozitivele vor fi deja luate. De asemenea, sursa recomandată de informații este [wiki-ul oficial Linux RAID](https://raid.wiki.kernel.org/index.php/Linux_Raid#When_Things_Go_Wrogn)
drapel in
Mulțumiri. Am trecut deja peste informațiile de pe pagina mdadm din wiki, dar nu am văzut pagina Assemble Run. Voi lucra cu informațiile bune de acolo, precum și în acest răspuns.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.