Am urmatoarea problema:
ori de câte ori serverul meu este expus la internet, acesta devine inaccesibil după o anumită perioadă de timp. Perioadele de timp variază. Ori de câte ori se întâmplă acest lucru, pot ping serverul din rețeaua mea locală, dar nu pot ajunge la el prin adresa lui dyndns din browserul meu, adresa lui IP și, de asemenea, nu pot accesa ssh în el. Singura modalitate pe care am găsit-o de a o remedia până acum este repornirea mașinii.
Problema începe de obicei să apară după aproximativ o zi și de obicei se întâmplă peste noapte. M-am uitat la jurnalele și am ajuns la următoarea concluzie:
Managerul de rețea (NetworkManager.service) se blochează și nu repornește până la repornire:
22 ian 02:25:52 mussingerwebserver dockerd[2161]: time="2022-01-22T02:25:07.391683481+01:00" level=warning msg="Verificarea stării de sănătate a containerului efbdf23db0420830585080808080000000000000000000000000000000001
22 ianuarie 02:26:32 mussingerwebserver kernel: [UFW BLOCK] IN=enp1s0 OUT= MAC=01:00:5e:00:00:fb:b0:35:b5:df:07:d2:08:00 SRC= 192.168.178.66 DST=224.0.0.251 LEN=32 TOS=0x00 PREC=0x00 TTL=1 ID=17286 PROTO=2
22 ian 02:25:33 mussingerwebserver CRON[16536]: (www-data) CMD (php7.2 -f /var/www/nextcloud/cron.php)
22 ianuarie 02:25:47 mussingerwebserver NetworkManager[1229]: <info> [1642814746.7425] manager: starea NetworkManager este acum CONNECTED_GLOBAL
22 ianuarie 02:26:45 mussingerwebserver whoopsie[1951]: [02:25:52] Nu s-a putut obține lista de conexiuni active: a fost atins termenul de expirare
22 ianuarie 02:26:45 mussingerwebserver whoopsie[1951]: [02:26:02] Nu se poate ajunge la: https://daisy.ubuntu.com
22 ian 02:27:06 mussingerwebserver dockerd[2161]: time="2022-01-22T02:25:17.538581342+01:00" level=warning msg="Verificarea stării de sănătate a containerului f3b354722bbd1660ddd1e3781ddd1937840000000000000000000
22 ian 02:27:06 mussingerwebserver dockerd[2161]: time="2022-01-22T02:25:17.538881010+01:00" level=warning msg="Verificarea stării de sănătate a containerului 7c7475150e0df2f4864bf4974949494747475150e0df2964bf494949747475150
22 ian 02:27:06 mussingerwebserver dockerd[2161]: time="2022-01-22T02:25:17.672603919+01:00" level=warning msg="Verificarea stării de sănătate a containerului c050c59619978171941941919000000000000000000000000000000000000001
22 ian 02:27:06 mussingerwebserver dockerd[2161]: time="2022-01-22T02:25:17.538587478+01:00" level=warning msg="Verificarea stării de sănătate a containerului fb75e0eeb20a37261640204137263474241420202020202012000000000000001
ESCOD
acest lucru arată clar că Managerul de rețea eșuează aproximativ în același timp (serverul a rulat tot timpul, dar Managerul de rețea nu a scris nimic în jurnal):
22 ianuarie 00:46:08 mussingerwebserver NetworkManager[1229]: <info> [1642808768.036
22 ianuarie 00:50:39 mussingerwebserver NetworkManager[1229]: <info> [1642809039.276
22 ianuarie 01:56:08 mussingerwebserver NetworkManager[1229]: <info> [1642812968.055
22 ianuarie 01:56:08 mussingerwebserver NetworkManager[1229]: <info> [1642812968.055
22 ianuarie 02:00:39 mussingerwebserver NetworkManager[1229]: <info> [1642813239.265
22 ianuarie 02:21:08 mussingerwebserver NetworkManager[1229]: <info> [1642814468.045
22 ianuarie 02:21:08 mussingerwebserver NetworkManager[1229]: <info> [1642814468.045
22 ianuarie 02:25:47 mussingerwebserver NetworkManager[1229]: <info> [1642814746.742
-- Reporniți --
22 ianuarie 09:37:42 mussingerwebserver systemd[1]: Se pornește Network Manager...
Recent i-am blocat conectarea la internet pentru un timp (câteva săptămâni) și nu s-a comportat așa o singură dată. Acum câteva zile l-am expus din nou și problema a început să reapară.
Sistemul:
PC desktop vechi care rulează Ubuntu 18.04.6 LTS
are Nextcloud, Unifi Network manager, Influxdb și netdata instalate
Nextcloud este expus la internet prin duckdns (pe o Fritzbox) cu un certificat SSL letsencrypt
aparatul este conectat prin ethernet
Am încercat:
pentru a localiza logul apport în /var/crash.Acest director nu are niciun raport de avarie de la incident, totuși am reușit să fac apport să genereze un raport de avarie prin mizerie și lansând o comandă neacceptată. M-am gândit mai întâi că ar putea să nu aibă permisiunile necesare pentru a scrie în /var/crash, dar nu pare să fie cazul.
De asemenea, am verificat dacă este activat Restart on failure și se pare că este,
/lib/systemd/system/NetworkManager.service afirmă:
Restart=la eșec
În acest moment nu mai știu ce să caut și sper că cineva mă poate ajuta cu următoarele întrebări:
- De ce se blochează NetworkManager?
- Aceasta este rădăcina problemei mele sau este doar un simptom?
- De ce apport nu reușește să genereze un jurnal de erori? Apare în mod clar o eroare, de ce altfel ar fi declanșat whoopsie.
- De ce NetworkManager nu repornește chiar dacă configurația sa specifică acest lucru?
Sper că cineva mă poate ajuta