Rulez un set mic de noduri Docker Swarm pe Raspberry Pis și folosesc glusterfs ca stocare partajată pentru volumele docker. Am configurat inițial acest lucru în timp ce eram pe Ubuntu Server 21.04 (hirsute) care are gluster 9.0 inclus în pachetele sale implicite. Acest lucru a funcționat excelent, cu doar blip-uri ocazionale în volumele montate, aparent când unele actualizări s-ar aplica în tăcere în fundal.
Cu toate acestea, de când am actualizat toate cele 3 noduri la 21.10 (impish) și, prin urmare, gluster 9.2, nu am avut un sfârșit de probleme în care atunci când unele containere pornesc și interacționează cu fișierele lor (specificele despre acest lucru sunt încețoșat), montez .glusterfs de pe nodul în care rulează containerul (și se întâmplă pe orice nod) se blochează aparent cu mesajul de jurnal de mai jos de la journalctl pentru unitatea de montare aferentă:
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: cadre în așteptare:
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: frame : type(0) op(0)
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: frame : type(0) op(0)
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: cadru : tip(1) op(LK)
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: frame : type(0) op(0)
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: frame : type(0) op(0)
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: cadru : tip(1) op(DESCHIS)
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: cadru : tip(1) op(DESCHIS)
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: set de corecții: git://git.gluster.org/glusterfs.git
12 dec 05:18:42 node1 mnt-gfs-docker1[12330]: semnal primit: 11
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: ora prăbușirii:
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: 2021-12-12 05:18:42 +0000
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: detalii de configurare:
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: argp 1
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: backtrace 1
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: dlfcn 1
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: libpthread 1
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: llistxattr 1
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: setfsid 1
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: spinlock 1
Dec 12 05:18:42 node1 mnt-gfs-docker1[12330]: epoll.h 1
Dec 12 05:18:42 node1 mnt-gfs-docker1[12330]: xattr.h 1
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: st_atim.tv_nsec 1
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: pachet-șir: glusterfs 9.2
12 decembrie 05:18:42 node1 mnt-gfs-docker1[12330]: ---------
12 decembrie 05:20:39 node1 systemd[1]: Se demontează /mnt/gfs/docker1...
Dec 12 05:20:39 node1 systemd[1]: mnt-gfs-docker1.mount: Dezactivat cu succes.
12 decembrie 05:20:39 node1 systemd[1]: Demontat /mnt/gfs/docker1.
Dec 12 05:20:39 node1 systemd[1]: mnt-gfs-docker1.mount: Timp CPU consumat 6h 49min 33.197s.
Deoarece sunt nou în gluster, nu există nimic aici care să înțeleg de ce se întâmplă acest lucru și nu găsesc detalii despre ceea ce s-ar putea întâmpla la momentul respectiv. Am verificat starea de vindecare a volumului și nu există fișiere în așteptare și, după o vindecare completă, nu au existat sincronizări (chiar și cu câteva containere încă în funcțiune).
tldr; volumul gluster continuă să se demonteze/se prăbușește pe nodurile client, în ciuda faptului că nu există probleme cu cărămizile gluster subiacente, fără intrări evidente în jurnal, în ciuda celor de mai sus, în care nu pot vedea o problemă listată în
Ce cauzează acest lucru și cum îl pot preveni?