Ieri, în jurul orei 21:30 GMT, serverul meu de pe AWS Lightsail s-a prăbușit. Nu mă pot conecta la el prin SSH. De asemenea, nu mă pot conecta la un server mic separat, care a verificat timpul de funcționare al primului. Mă pot conecta prin browser SSH, dar nu prin SSH, chiar și după repornirea instanțelor.
Deoarece acestea sunt două servere separate, fără conexiune publică unul la altul, mă întreb dacă Lightsail ar putea avea unele probleme tehnice. Dar, deoarece sunt pe planul de bază, asistența nu este inclusă.
Cum pot investiga problema?
Actualizați
Am verificat patru logari /var/log
: auth.log
, apport.log
, kern.log
și syslog
pe instanța Lightsail care rulează o imagine bitnami și un server NodeJS.
kern-log
a arătat vinovatul. De obicei are foarte puține intrări, aproximativ 5. În jurul acestei date, are 500 de rânduri, începând cu:
29 ianuarie 21:39:41 ip-172-26-9-252 kernel: [ 0.000000] Se inițializează cpuset subsistem cgroup
si se termina cu:
29 ianuarie 21:39:41 ip-172-26-9-252 kernel: [ 20.435952] audit: type=1400 audit(1643492358.140:11): apparmor="STATUS" operation="profile_load" profile="unconfined" name= "/usr/lib/lxd/lxd-bridge-proxy" pid=708 comm="apparmor_parser"
Cealaltă instanță Lightsail, care rulează o imagine diferită într-o regiune diferită și nu este configurată ca server web, arată intrări similare în acea perioadă. Prima linie este:
30 ianuarie 07:27:17 ip-172-26-5-35 kernel: [ 0.000000] Se inițializează cpuset subsistem cgroup
iar ultima este:
30 ianuarie 07:27:17 ip-172-26-5-35 kernel: [ 9.476419] cgroup: noile opțiuni de montare nu se potrivesc cu superblocul existent, vor fi ignorate
Deci aceasta pare să fi fost o problemă Lightsail, deoarece a afectat două instanțe separate aproximativ în același timp. Cum pot confirma asta?