Mă confrunt cu o problemă extrem de ciudată în ceea ce privește un server, se blochează/se blochează aleatoriu fără ieșire pe server și nu răspunde la tastele scurte și necesită pornire la rece, atunci când pornire cu pornire la rece, fără erori pe ecranul de pornire.
Nu îngheață deloc sub sarcină grea, cu aproximativ 9-20% prăbușire CPU web, încărcare medie în jur de 2-5 (cpu cu 12 nuclee)
si 128gb ram
Am încercat să verificăm jurnalele, nimic nu se afișează ca panica nucleului sau orice se referă la problema în sine.
În toate blocările după pornirea la rece, când verificăm jurnalul, vedem că OOM reaper obișnuit distruge procesele php (utilizatorii ajung la limite), dar nimic prea abuziv, dar întotdeauna pe OOM,
Uneori, când serverul îngheață în jurnal, vedeți ora curentă și, uneori, așa cum se arată după ora curentă a blocării, câteva linii de la data mai veche și se blochează.
Nimic din jurnale nu poate determina software-ul legat, sau sub sarcină grea, doar funcționarea normală, aceasta este o mașină actualizată de la una veche, care a fost stabilă de ani de zile.
Înghețarile sunt aleatorii, ar putea fi după o săptămână de funcționare a serverului, sau două zile sau trei săptămâni și etc...
De asemenea, am încercat să extragem vmcore dump din serverul înghețat, dar tot nu se prinde nimic acolo.
Este doar înghețat fără ieșire pe ecran, dar serverul încă rulează, dar nu poate fi imprimat, nu pot accesa nimic ssh, de asemenea, kvm, așa cum am spus, nu arată nicio ieșire pe ecran.
Ar putea avea legătură cu hardware-ul defect? Deoarece suspensia mea este despre RAM defectă?
Sunt extrem de pierdut cu problema asta...
Mulțumiri