Pentru a vă înțelege mediul și pentru a face planificarea capacității, aveți nevoie de o anumită gândire și judecată. Ce înseamnă pentru organizație faptul că această gazdă are performanțe bune? Sugestie: utilizatorilor le pasă dacă „este lentă”, nu utilizarea memoriei sau a procesorului. Cât de departe puteți împinge utilizarea și încă aveți o marjă de siguranță adecvată?
Se pare că folosești priviri, un monitor de resurse bazat pe Python psutil. La prima vedere (ha) are UX decent, surse de date sănătoase și vă vorbește despre alerte, frumos. Alerte de memorie implicite sunt 50% 70% 90%, ceea ce pentru mine este destul de conservator și escaladează de la mai mult decât suficient la îngrijorător la presiune mare de memorie. Verificați dacă acest lucru are sens în mediul dvs., configurați diferite praguri dacă este necesar.
Dar ce procent din metrica memoriei? Pe Linux, privirile deferă la psutil. psutil calculează minus total disponibil. Ceea ce este un lucru rezonabil de făcut, cache-urile și alte lucruri ușor de recuperat sunt excluse din raport. Deși există calcule vechi de rezervă pentru nucleele vechi, modul în care este măsurat poate varia.
În timpul acestor alerte de consum de memorie „ridicat”, colectați brut /proc/meminfo
ieșire și analizați-o. Este posibil ca consumul de memorie să existe în afara spațiului de adrese al procesului. Inclusiv segmente de memorie partajată sau structuri de date ale nucleului.
Această gazdă este un sistem systemd care rulează docker și alte câteva lucruri. Obțineți utilizarea memoriei pe grup rulând systemd-cgtop --order=memorie
și statistici docker
Adesea, statisticile pe grup sunt mai ușor de înțeles decât contabilizarea numeroaselor procese din sistem. Poate containerele încă mai există, chiar dacă majoritatea proceselor lor s-au oprit.