Puncte:0

Ubuntu Server 20.04 îngheață la fiecare două zile

drapel br

Scurtă introducere

De câteva zile, serverul meu fizic continuă să înghețe la fiecare 2 sau 3 zile. Am înlocuit deja tot hardware-ul, inclusiv unitățile și am făcut o nouă instalare a Ubuntu.

Detalii și constatări

Niciun noroc până acum când căutați fișierele jurnal:

  • Fiecare fișier jurnal syslog sau kernel este afișat ^@^@^@^@^@^@^@^@^@^@^@^@ în momentul îngheţului. Înainte de aceasta, nu există niciun comportament suspect cu cel puțin 15 minute înainte de momentul înghețului.
  • Jurnalele de jurnal de la ultima repornire pot fi găsite Aici. De când conduc UFW, este puțin dezordonat. The îngheța a avut loc la cca. 09:45h.
  • Am serverul în monitorizare. Nu există o creștere a CPU, RAM, DiskIO, spațiu pe disc și nici trafic pe interfața de rețea cu puțin timp înainte de înghețarea. CPU, RAM și spațiul pe disc, de asemenea, nu depășesc o limită.
  • Odată ce serverul se blochează, nu mai pot face nimic la consolă. Trebuie să repornesc serverul (resetare hard) pentru a-l relua pentru câteva zile.
Ce rulez pe server:
  • nginx
  • php-fpm
  • laravel 8
  • ufw
  • fail2ban
  • mysql 8
Acțiuni pe care le-am întreprins deja, găsite în postări similare:
  • Reglați memoria RAM liberă minimă:
    • sysctl -w vm.min_free_kbytes=235929
    • sysctl -w vm.swappiness=5

Deoarece majoritatea jurnalelor arată câteva semne aleatorii, apreciez orice ajutor ce să fac în continuare. Nu știu ce altceva aș putea verifica. Vă mulțumim pentru orice sfaturi și ajutor oferit!

Puncte:1
drapel id
  1. Încercați diferite versiuni de kernel (kernel-uri ale altor versiuni Ubuntu, de exemplu 18.04, 22.04, o versiune a nucleului principal) și vedeți dacă problema persistă. Dacă serverul dvs. nu se blochează cu alte versiuni de kernel, atunci aveți de-a face cu o eroare a nucleului care afectează 20.04.
  2. Se pare că chiar dacă nucleul percepe eșecul, nu poate scrie problema în syslog. Verificați dacă vedeți o panică de kernel pe consolă, dar dacă ecranul este oprit, nu îl puteți reporni cu un nucleu blocat. Deci, ar trebui să dezactivați ecranul care se stinge din cauza inactivității. De asemenea, puteți încerca să utilizați un crashkernel (kdump) pentru a obține mai multe informații despre accident; sau probabil că puteți redirecționa ieșirea consolei către portul serial și puteți înregistra ieșirea cu un dispozitiv extern, dar nu am încercat niciodată asta.
  3. De asemenea, puteți testa diferite versiuni Ubuntu cu totul, sau poate diferite distribuții Linux, dar de obicei acest lucru nu este necesar (de obicei, blocările sunt cauzate de kernel și driverele acestuia, distribuția construită în jurul acestuia contează rareori). Puteți chiar să încercați un alt sistem de operare, cum ar fi FreeBSD sau Windows, pentru a vedea dacă computerul continuă să înghețe â dacă înghețarea se întâmplă și cu alte sisteme de operare, cu siguranță aveți o problemă hardware.
  4. Alerga memtest pentru a detecta eventualele module RAM defecte. Memtest are nevoie de control deplin asupra computerului (trebuie să-l porniți în loc de sistemul dvs. de operare), astfel încât serverul dumneavoastră nu poate funcționa în timp ce testul rulează.
  5. Din păcate, defecțiunile hardware pot fi destul de insidioase atunci când nu este evident care este problema. Nu știu ce ai înlocuit, dar poți avea chiar și o placă de bază, un procesor sau un PSU defecte. Odată ce computerul meu s-a oprit aleatoriu. La început nu aveam idee care este cauza, dar apoi s-a dovedit că cablul meu de alimentare are probleme de contact – înlocuirea lui a încetat problema.
k304 avatar
drapel br
Multumesc pentru raspuns. Am înlocuit deja tot hardware-ul (de fapt este un server găzduit la o companie franceză, așa că mi-au spus că au înlocuit complet tot hardware-ul). Inclusiv CPU, placa de bază, etc. Deci, probabil, nu este o problemă hardware, dar au găsit RAM și placa de bază defecte pe vechiul server. Am încercat deja diferite versiuni de kernel. Și chiar am actualizat kernel-ul în ultima vreme, deoarece a existat o versiune mai nouă. Mă voi uita la `kdump` și voi vedea ce îmi va raporta.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.