Puncte:1

Cum se face utilizabil un GPU într-o mașină virtuală ubuntu 20.04 nou-nouță?

drapel in

Am încercat toată ziua să fac acest GPU (v100) să funcționeze pe o nouă mașină virtuală ubuntu. Am încercat să instalez driverele și să repornesc și, de asemenea, să șterg/dezinstalez tot ce are de-a face cu nvidia, dar niciunul dintre aceste lucruri nu pare să funcționeze.

În special, am rulat asta în mod specific:

actualizare apt;
apt install build-essential;

sudo add-apt-repository ppa:graphics-drivers
sudo apt install ubuntu-drivers-common
dispozitive ubuntu-driver
sudo apt-get install nvidia-driver-460
sudo reporniți acum

Apoi, uneori, se pare că nvidia-smi funcționează (în momentul scrierii acestei întrebări nu a fost așa că nu am putut să copiez și lipiți ceea ce se spune când funcționează), dar când nu funcționează, spune asta:

(sinteză) miranda9@miranda9:~$ nvidia-smi
Nu se poate determina mânerul dispozitivului pentru GPU 0000:00:06.0: Eroare necunoscută

orice ajutor este apreciat.

Rețineți că, de asemenea, nu am acces la fișierul VMs vmx, așa că această întrebare și răspunsurile sunt inutile/nesens pentru mine: https://forums.developer.nvidia.com/t/nvidia-smi-reports-unable-to-determine-the-device-handle-for-gpu/46835

În plus, am încercat să dezinstalez totul din nivida și să-l reinstalez cu:

sudo apt-get --purge elimina "*nvidia*"
sudo /usr/bin/nvidia-uninstall

atunci

actualizare apt;
apt install build-essential;

sudo add-apt-repository ppa:graphics-drivers
sudo apt install ubuntu-drivers-common
dispozitive ubuntu-driver
sudo apt-get install nvidia-driver-460
sudo reporniți acum

dar asta nu pare să funcționeze


Mai multe informații în cazul în care vă ajută:

(sinteză) miranda9@miranda9:~$ lsb_release -a
Nu sunt disponibile module LSB.
ID distribuitor: Ubuntu
Descriere: Ubuntu 20.04.2 LTS
Lansare: 20.04
Nume de cod: focal

de asemenea:

(sinteză) miranda9@miranda9:~$ python
Python 3.9.5 (implicit, 4 iunie 2021, 12:28:51) 
[GCC 7.5.0] :: Anaconda, Inc. pe Linux
Tastați „ajutor”, „drept de autor”, „credite” sau „licență” pentru mai multe informații.
>>> import lanternă
>>> torch.cuda.is_available()
/home/miranda9/miniconda3/envs/synthesis/lib/python3.9/site-packages/torch/cuda/__init__.py:52: UserWarning: CUDA initialization: Eroare neașteptată de la cudaGetDeviceCount(). Ați rulat câteva funcții cuda înainte de a apela NumCudaDevices() care ar putea fi setat deja o eroare? Eroare 101: ordinal dispozitiv nevalid (declanșat intern la /opt/conda/conda-bld/pytorch_1623448238472/work/c10/cuda/CUDAFunctions.cpp:115.)
  return torch._C._cuda_getDeviceCount() > 0
Fals

După cum se solicită prin comentariu:

# lspci
00:00.0 Punte gazdă: Intel Corporation 440FX - 82441FX PMC [Natoma] (rev 02)
00:01.0 ISA bridge: Intel Corporation 82371SB PIIX3 ISA [Natoma/Triton II]
00:01.1 Interfață IDE: Intel Corporation 82371SB PIIX3 IDE [Natoma/Triton II]
00:01.2 Controler USB: Intel Corporation 82371SB PIIX3 USB [Natoma/Triton II] (rev 01)
00:01.3 Bridge: Intel Corporation 82371AB/EB/MB PIIX4 ACPI (rev 01)
00:02.0 Controler compatibil VGA: Cirrus Logic GD 5446
00:03.0 Controler de stocare SCSI: XenSource, Inc. Xen Platform Device (rev 01)
00:05.0 Periferic de sistem: XenSource, Inc. Citrix XenServer PCI Device for Windows Update (rev 01)
00:06.0 Controler 3D: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)

alt vm:

$ lspci
00:00.0 Punte gazdă: Intel Corporation 440FX - 82441FX PMC [Natoma] (rev 02)
00:01.0 ISA bridge: Intel Corporation 82371SB PIIX3 ISA [Natoma/Triton II]
00:01.1 Interfață IDE: Intel Corporation 82371SB PIIX3 IDE [Natoma/Triton II]
00:01.2 Controler USB: Intel Corporation 82371SB PIIX3 USB [Natoma/Triton II] (rev 01)
00:01.3 Bridge: Intel Corporation 82371AB/EB/MB PIIX4 ACPI (rev 01)
00:02.0 Controler compatibil VGA: Cirrus Logic GD 5446
00:03.0 Controler de stocare SCSI: XenSource, Inc. Xen Platform Device (rev 01)
00:05.0 Periferic de sistem: XenSource, Inc. Citrix XenServer PCI Device for Windows Update (rev 01)
00:06.0 Controler 3D: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)

Resurse pe care le-am căutat ajutor:

ChanganAuto avatar
drapel us
Într-o VM hardware-ul este virtualizat. Nu utilizați adevăratul GPU Nvidia, sistemul de operare gazdă este.
drapel cc
Aruncă o privire la rezultatele Google ale mașinii virtuale Nvidia Gpu Passthru
Charlie Parker avatar
drapel in
@ubfan1 doar pentru a mă asigura că mă uit în locul potrivit. Trebuie să caut pe Google `passthru`, nu `passthru`? de exemplu. google `nvidia virtual machine gpu passthru` - nu?
drapel cc
„passthru” a apărut ca o alegere timpurie pe măsură ce am început să scriu, așa că am selectat-o. GPU-ul meu este prea vechi pentru ca asta să funcționeze pentru mine, așa că nu am verificat mult mai mult.
Charlie Parker avatar
drapel in
Vrei să elaborezi voturile negative?
Charlie Parker avatar
drapel in
@NateT da, sunt fericit. Vedeți actualizarea întrebării. Cu toate acestea, suspiciunea mea este că doar eliminarea totul din nvidia și apoi reinstalarea lui cu o repornire ar trebui să funcționeze, dar încercările mele de a face acest lucru eșuează.
Irsu85 avatar
drapel cn
Trebuie să utilizați PCIe passthrough și 2 GPU-uri fizice în computer pentru a face acest lucru. De asemenea, aveți nevoie de un al doilea monitor conectat la al doilea GPU. Pentru comenzile practice și așa, încercați să utilizați https://pve.proxmox.com/wiki/PCI(e)_Passthrough
Nate T avatar
drapel it
Ce imagine ai folosit pentru VM. Ca în numele complet al imaginii? Voturile negative se datorează probabil că o VM nu are un GPU.Presupun că vrei să spui „cum se face ca vm să folosească GPU gazdă”? Btw nu eram eu, dv doar în situații extreme. Sunt prea sărac. XD
Puncte:0
drapel zw

O mașină virtuală emulează o placă grafică, deci ar trebui să fie transparentă pentru sistemul oaspete ce placă nativă aveți pe sistemul dumneavoastră gazdă. VM-urile sunt pentru „partajarea” resurselor - spre deosebire de un sistem real care are acces direct la hardware-ul său. Deci nu va avea sens să instalați drivere Nvidia pe un sistem gazdă. Puteți verifica acest lucru verificând driverele actuale din VM:

inxi -G

(executat într-un terminal) vă va arăta un driver VM/oracle, nu cardul dumneavoastră nativ.

Obținerea unei ieșiri grafice de înaltă performanță poate fi atinsă cu ajustări și trucuri, dar VM-urile nu sunt concepute pentru așa ceva...

Charlie Parker avatar
drapel in
salut, multumesc pentru raspuns, a fost informativ! Nu am acces la sistemul gazdă. Solicit un VM și primesc un VM de folosit. Pot fi sudo în el, dar sunt în VM desigur. De ce crezi că nu funcționează modul în care instalez driverele? Ce anume merge prost în opinia ta?
kanehekili avatar
drapel zw
OK, deci VM-ul este pe o gazdă la distanță. Ce spune `inxi -G` pe "VM la distanță"? Dacă nu există, încercați cu `sudo apt install inxi`

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.