Rulez pe un server dedicat âcu versiunea Ubuntu 20.04.3 LTS
(nucleu 5.4.0-96-generic
) și Docker 20.10.7, build 20.10.7-0ubuntu5~20.04.2
. Sistemul este o instalare proaspătă.
Am un Dockerfile
pentru unul dintre serviciile mele, care atrage câteva biblioteci cu apt
și du-te și ia
. Unul dintre containerele intermediare nu reușește întotdeauna să se conecteze la internet cu erori DNS sau TCP Timeout. Care dintre containere eșuează este complet aleatoriu.
De asemenea, rețineți că problema nu este cu un serviciu specific, am încercat să construiesc un serviciu complet diferit care rulează pe NodeJS și instalare npm
a esuat cu aceleasi erori
Astăzi am avut și problema cu care containerul meu Nginx nu era accesibil. Toate conexiunile la acesta au dus la erori de timeout.
De asemenea, conexiunile dintre containere care folosesc rețele docker nu funcționează corect.
Alergare sudo systemctl restart docker
rezolvă temporar problema, dar reapar una sau două versiuni pe linie. Când construiesc cu gazdă
de rețea în loc de rețeaua de punte implicită, problema a dispărut, motiv pentru care am suspectat o configurație de punte defectuoasă.
Am încercat să reinstalez Docker, să resetez iptables și configurațiile bridge, să setez diferite servere DNS, fără niciun rezultat. Fișierele jurnal docker nu prezintă erori.
Care ar putea fi cauza acestei probleme?
Actualizați:
Am dezactivat UFW, dar nu am avut succes.
Aceasta este o descărcare din jurnalul meu dmesg în timpul unei build care a expirat, poate că acest lucru ajută la identificarea cauzei:
[758001.967161] docker0: portul 1(vethd0c7887) a intrat în starea de blocare
[758001.967165] docker0: portul 1(vethd0c7887) a intrat în starea dezactivată
[758001.967281] dispozitivul vethd0c7887 a intrat în modul promiscuu
[758002.000567] IPv6: ADDRCONF(NETDEV_CHANGE): veth7e3840a: linkul devine gata
[758002.000621] IPv6: ADDRCONF(NETDEV_CHANGE): vethd0c7887: linkul devine gata
[758002.000644] docker0: portul 1(vethd0c7887) a intrat în starea de blocare
[758002.000646] docker0: portul 1(vethd0c7887) a intrat în starea de redirecționare
[758002.268554] docker0: portul 1(vethd0c7887) a intrat în starea dezactivată
[758002.269581] eth0: redenumit din veth7e3840a
[758002.293056] docker0: portul 1(vethd0c7887) a intrat în starea de blocare
[758002.293063] docker0: portul 1(vethd0c7887) a intrat în starea de redirecționare
[758041.497891] docker0: portul 1(vethd0c7887) a intrat în starea dezactivată
[758041.497997] veth7e3840a: redenumit din eth0
[758041.547558] docker0: portul 1(vethd0c7887) a intrat în starea dezactivată
[758041.551998] dispozitiv vethd0c7887 a lăsat modul promiscuu
[758041.552008] docker0: portul 1(vethd0c7887) a intrat în starea dezactivată