După cum a menționat Gerald, Ubuntu 16.04 este învechit și ar trebui să fie actualizat (sau obțineți un nou server cu 20.04 și opriți-l pe cel vechi).
După 6 luni de funcționare constantă, o mică eroare care forțează o repornire nu este puțin probabilă. Există mai multe motive pentru acest lucru și ceea ce te-ai uitat ar fi putut să-ți ofere un indiciu, dar când nu vezi absolut nimic, există două motive principale pentru care s-ar putea întâmpla:
- S-a întrerupt curentul
- Eroare hardware care nu a putut fi detectată în software și serverul are un watchdog care îi permite cel puțin să se închidă (poate că a trimis un mesaj APCI, deși acesta ar fi putut fi înregistrat, dacă hardware-ul nu funcționează destul de bine, software-ul ar eșua raportând problema)
Dacă nu s-a repornit automat, a fost doar blocat, ceea ce indică, de asemenea, o problemă hardware și software-ul nu a avut niciodată șansa de a face nimic în acest sens.
The /proc/sys/kernel/panic
fișierul este un steag pentru a spune nucleului ce trebuie să facă în cazul unei erori detectate de kernel (adică în software). Puteți găsi detalii Aici. Din moment ce spui că este zero, nu s-ar reporni automat în software în caz de panică.
La mine, am avut odată o problemă cu un receptor Bluetooth. Ar primi atât de multe accesări încât, după câteva minute, ar crea un blocaj în nucleu. Cu toate acestea, nu a fost raportat clar în jurnalele. Computerul respectiv avea însă un mod de depanare și puteam asculta mesaje pe portul USB. Asta mi-a oferit informațiile de care am nevoie (tone de mesaje despre Bluetooth). Oprirea acestuia a făcut din nou sistemul stabil. Din moment ce ai avut un singur eveniment, nu mi-aș face griji pentru el. Dacă se repetă din nou și din nou, probabil că este timpul să luați în considerare utilizarea unui hardware diferit.