Recent am implementat ceva hardware nou și, din ziua 1, am experimentat reporniri aleatorii, multe dintre ele. De fapt, am lucrat la consolă și tocmai a fost repornit fără niciun avertisment.
Am străbătut o grămadă de gropi de iepuri încercând să depanăm, dar până acum nu s-a întâmplat nimic. Se întâmplă pe mai multe dispozitive, ceea ce mă face să cred că nu este o problemă hardware cu un dispozitiv prost.
Mai întâi ne-am gândit că ar putea fi căldură, deoarece acestea sunt desfășurate „pe teren”, dar repornirile au loc la toate orele din zi/noapte, nu doar în cele mai fierbinți momente ale zilei. Uneori este în miezul nopții când în dulap sunt 50 de grade F și dispozitivul funcționează la cea mai mică sarcină.
Cu toate acestea, pare să fie în perioadele de cea mai mare încărcare a procesorului. Iată intrările recente din „ultima repornire”:
reporniți sistemul de pornire 5.4.0-77-generic Duminica 1 august 17:31 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic Duminica 1 august 15:48 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic Duminica 1 august 15:32 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic sâmb. 31 iulie 19:02 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic sâmb. 31 iulie 17:56 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic Sâmbătă, 31 iulie 17:30 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic sâmb. 31 iulie 17:17 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic sâmb. 31 iulie 16:52 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic Sâmbătă, 31 iulie 16:40, încă rulează
reporniți sistemul de pornire 5.4.0-77-generic vineri, 30 iulie 23:13 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic vineri, 30 iulie 22:37 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic vineri, 30 iulie 22:05 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic vineri, 30 iulie 21:42 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic vineri, 30 iulie 21:24 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic vineri, 30 iulie 20:53 încă rulează
reporniți sistemul de pornire 5.4.0-77-generic vineri, 30 iulie 20:42 încă rulează
dmesg nu arată nimic util legat de reporniri. Am urmărit /var/log/kern.log și syslog.log toată ziua, dar nu a fost adăugat nimic chiar înainte de repornire.
Gândindu-ne că ar putea fi legat de căldură, am făcut un „watch -n 1 sensors” în orele în care este cel mai probabil să se repornească și, deși procesorul era „cald”, era încă sub limita HIGH și 20-30 de grade. C mai mic decât limita CRITICĂ care, după cum am înțeles, este locul în care s-ar opri/reporni.
Ce putem încerca în continuare pentru a găsi cauza acestor reporniri?
Mulțumiri.