Puncte:0

Cum se monitorizează utilizarea CPU și GPU în rândul utilizatorilor?

drapel vg

Am mai mulți utilizatori (cu conturi de utilizator conform /etc/passwd) care SSH pe o mașină Ubuntu pe care o gestionez. Acestea sunt informațiile mele de sistem:

ID distribuitor: Ubuntu
Descriere: Ubuntu 20.04.3 LTS
Lansare: 20.04
Nume de cod: focal

HW-ul este un Intel Xeon E3 cu două socluri (16 nuclee în total) cu x2 plăci GPU NVidia GTX 970. Există aproximativ 6 TB în mașina de spațiu intern pe HDD.

Fiecare utilizator poate folosi tmux pentru a executa un proces care persistă după ce sa deconectat. Vă rugăm să rețineți că nu am nimic sofisticat, cum ar fi un job manager precum SLURM; Sunt departe de asta, așa că vă rog să nu sugerați.

Ar putea cineva recomanda software pentru a monitoriza utilizarea CPU și GPU de către utilizator și pentru a raporta, de exemplu, 1000 de ore CPU/GPU etc., într-o anumită perioadă de timp? Software-ul trebuie să poată înregistra utilizatorul, procesorul și GPU, iar dacă este posibil procesul/software-ul executat.

paladin avatar
drapel kr
Nu este o monitorizare, dar puteți edita `/etc/security/limits.conf` și puteți ajusta limitele de utilizator/grup pentru utilizarea CPU și alte resurse de sistem.
Puncte:1
drapel in

Ceva asemănător cu sar și sadf (parte a pachetului sysstat) poate face o contabilitate completă a CPU.

Cu toate acestea, în prezent există puține sau deloc instrumente care pot oferi o contabilitate bună a GPU. Slurm o poate face doar prin restricționarea și programarea strictă a accesului la GPU, nu prin măsurarea utilizării reale.

Dacă cineva ar scrie un sistem ca acesta, ar trebui să folosească bibliotecile nvml nvidia. API-ul pentru monitorizarea GPU s-a schimbat complet de mai multe ori în ultimii ani, așa că un astfel de instrument ar necesita rescrieri frecvente pentru a ține pasul cu modificările din driverul nvidia și din biblioteca nvml.

drapel vg
Că tu pentru ajutorul tău. Exact asta trebuia să știu. Sunt mulțumit că am lăsat monitorizarea GPU-ului să alunece dacă va fi mult prea mult de lucru.
user10489 avatar
drapel in
Folosesc o soluție care face eșantionare cu collectd și un plugin python collectd disponibil în pip. Dar aceasta se referă numai la utilizarea GPU-ului general, nu la utilizarea pe utilizator.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.