Am o aplicație java care rulează pe o instanță ec2. Nginx și mongodb rulează și pe instanță. Aplicația este accesată prin ELB care transmite cereri către instanță.
Am 2 versiuni ale aceleiași instanțe care rulează, una care primește puțin mai mult trafic decât cealaltă (deoarece una servește activele pentru ambele aplicații). Cu toate acestea, doar instanța principală, de servire a activelor, se prăbușește.
Cele mai multe dimineți, instanța ec2 cade și, prin urmare, aplicația nu mai rulează acolo unde primesc un text de la sns. Este adesea la 4:01 am UTC (ceea ce nu pare a fi o coincidență), dar au existat și alte ore de eșec, de la 1:26 a.m. la 5:21 a.m.
Acest lucru este ciudat, deoarece aplicația este folosită ziua și nu noaptea. Am confirmat acest lucru atât cu jurnalele nginx de pe instanță, cât și cu jurnalele aplicației.
Instanța este un t2.micro, dar înainte de a crește acest lucru, aș dori să înțeleg cauza problemei, deoarece în perioadele de maximă utilizare pare să se descurce bine și nu are sens de ce nu eșuează dimineața devreme.
În momentul în care apare problema, există o creștere minoră a utilizării procesorului de la ~2% la ~8%.
Statistica suspectă este o creștere uriașă a Lățimii de bandă de citire a volumului ebs chiar înainte de accident, care pare să se mențină până la repornire.
vârf în lățimea de bandă citită pe ebs
Singura activitate pe care o cunosc pe volum este un salt de rezervă mongo care aruncă baza de date și încarcă o arhivă în s3 la 2:40 a.m.
Poate cineva să-mi dea vă rog niște informații despre ce cauzează acest lucru?
Scuze dacă acestea nu sunt suficiente informații