Nota
- Questa esercitazione richiede l'accesso a Oracle Cloud. Per iscriverti a un account gratuito, consulta Inizia a utilizzare Oracle Cloud Infrastructure Free Tier.
- Utilizza valori di esempio per le credenziali, la tenancy e i compartimenti di Oracle Cloud Infrastructure. Al termine del laboratorio, sostituisci questi valori con quelli specifici del tuo ambiente cloud.
Implementa NVIDIA RTX Virtual Workstation su Oracle Cloud Infrastructure
Introduzione
Il software NVIDIA RTX Virtual Workstation consente agli utenti di eseguire simulazioni ad alte prestazioni, rendering grafico e carichi di lavoro di progettazione nel cloud, con prestazioni native simili a quelle di una workstation. Sblocca potenti funzionalità di rendering fornite da API grafiche come OpenGL o DirectX, portando prestazioni grafiche rivoluzionarie nel cloud.
Obiettivo
- Sfrutta la tecnologia GPU virtuale RTX e NVIDIA utilizzando forme di computazione basate su GPU NVIDIA A10 su Oracle Cloud Infrastructure (OCI).
Task 1: eseguire il provisioning di un'istanza di computazione su OCI per NVIDIA RTX Virtual Workstation
-
Creare una rete cloud virtuale (VCN) e avviare un'istanza di computazione su OCI. Per ulteriori informazioni, consulta la sezione relativa alla creazione di una VCN e all'avvio dell'istanza di computazione.
-
Selezionare una delle forme GPU.A10 disponibili.
VM.GPU.A10.1 VM.GPU.A10.2 BM.GPU.A10.4
-
Quando si avvia un'istanza di computazione, modificare la forma in una delle forme riportate sopra. Per avviare la VM GPU.A10, fare clic su Specialità e generazione precedente e selezionare una delle forme VM.GPU.A10. Per i server Bare Metal, fare clic su Macchine Bare Metal e selezionare la forma BM.GPU.A10.4.
-
Se la tenancy non dispone di un limite di servizio impostato per GPU.A10, queste forme non saranno nella lista di forme.
-
Per controllare i limiti della tenancy nella console OCI, impostare l'area in cui eseguire il provisioning di un'istanza di computazione GPU.A10, aprire il menu di navigazione e fare clic su Governance e amministrazione.
-
In Gestione tenancy, selezionare Limiti, quote e uso.
-
Impostare il servizio su Compute, selezionare uno dei domini di disponibilità nell'ambito e immettere GPU.A10 nella risorsa.
-
Selezionare GPU per le istanze VM e BM basate su A10.
-
-
I limiti di computazione si riferiscono al dominio di disponibilità. Controlla se il limite è impostato in uno qualsiasi dei domini di disponibilità dell'area. Se il limite del servizio è impostato su 0 per tutti i domini di disponibilità, fare clic su richiedere un aumento del limite del servizio e sottomettere una richiesta di aumento del limite per questa risorsa. Per ulteriori informazioni sui limiti del servizio, consulta la sezione relativa ai limiti del servizio.
Nota: per accedere a Limiti, Quote e Uso è necessario essere membri del gruppo di amministratori della tenancy oppure è necessario che al gruppo sia assegnato un criterio per leggere LimitsAndUsageViewers.
-
Attualmente le forme di computazione GPU.A10 OCI supportano Oracle Linux, Ubuntu e Rocky Linux. Windows è supportato solo dalle forme VM.
Nota: Rocky Linux non è ufficialmente supportato da NVIDIA.
-
Quando si esegue il provisioning di un'istanza di computazione su OCI, utilizzare un'immagine del sistema operativo standard. Non utilizzare immagini abilitate per la GPU perché il driver GPU NVIDIA installato non supporta la workstation virtuale RTX (vWS) che richiede l'installazione del driver NVIDIA vGPU.
Task 2: Scaricare e installare il driver NVIDIA vGPU
-
Scaricare il driver NVIDIA vGPU come descritto in Download del software NVIDIA vGPU. Se non si dispone di un account enterprise con NVIDIA, è possibile registrarsi per la prova all'indirizzo Virtual GPU (vGPU) Software Free 90Days Trial - NVIDIA.
-
Accedi a NVIDIA Enterprise Application HUB utilizzando il tuo account NVIDIA Enterprise.
-
Aprire il portale per le licenze NVIDIA e selezionare Software Download. Applicare i filtri riportati di seguito.
-
Famiglia di prodotti: immettere VGPU.
-
Piattaforma: inserisci KVM Linux.
-
-
Ordina per data di rilascio e scarica il pacchetto con la versione più recente del driver vGPU per la piattaforma KVM Linux. Ad esempio, attualmente l'ultima versione di vGPU è la 17.4.
-
Estrarre il file e andare alla cartella
Guest_Drivers
. Lì troverete i file di installazione del driver vGPU per Windows e Linux.
Nota: se si utilizza Linux, seguire i task 3, 4, 5 e, se si utilizza Windows, andare al task 6.
Task 3: Installare il driver NVIDIA vGPU su Linux
-
Oracle Linux 8
-
Copiare il driver Linux NVIDIA
NVIDIA-Linux-x86_64-xxx.xx.xx-grid.run
nell'istanza di computazione di cui è stato eseguito il provisioning. -
Prima di installare il driver NVIDIA, abilitare il set di strumenti
gcc-12
eseguendo il comando seguente.sudo dnf install gcc-toolset-12 scl enable gcc-toolset-12 bash
-
Sarà inoltre necessario disabilitare il driver
nouveau
in conflitto con il driver NVIDIA. Eseguire il comando seguente per verificare se è stato caricato il drivernouveau
.lsmod | grep nouveau
-
Se nell'output del comando viene visualizzato il driver
nouveau
, sarà necessario prima disabilitarlo. Per disabilitare il drivernouveau
su Oracle Linux, creare il file/etc/modprobe.d/blacklist-nouveau.conf
e aggiungere il contenuto seguente.blacklist nouveau options nouveau modeset=0
-
Salvare il file e rigenerare initramfs.
sudo dracut --force
-
Dopo aver disabilitato il driver, riavviare il server.
sudo reboot
-
Eseguire il comando seguente per installare il driver NVIDIA vGPU.
sudo bash ./NVIDIA-Linux-x86_64-xxx.xxx.xx-grid.run
-
Ignorare le avvertenze e fare clic su OK per continuare l'installazione. Eseguire il reboot del server.
sudo reboot
-
-
Oracle Linux 9
-
Copiare il driver Linux NVIDIA
NVIDIA-Linux-x86_64-xxx.xx.xx-grid.run
nell'istanza di computazione di cui è stato eseguito il provisioning. -
Sarà inoltre necessario disabilitare il driver
nouveau
in conflitto con il driver NVIDIA. Eseguire quanto segue per verificare se è stato caricato il drivernouveau
.lsmod | grep nouveau
-
Se nell'output del comando viene visualizzato il driver
nouveau
, sarà necessario prima disabilitarlo. Per disabilitare il drivernouveau
su Oracle Linux, creare il file/etc/modprobe.d/blacklist-nouveau.conf
e aggiungere il contenuto seguente.blacklist nouveau options nouveau modeset=0
-
Salvare il file e rigenerare initramfs.
sudo dracut --force
-
Dopo aver disabilitato il driver, riavviare il server.
sudo reboot
-
Eseguire le operazioni riportate di seguito per installare il driver NVIDIA vGPU.
sudo bash ./NVIDIA-Linux-x86_64-xxx.xxx.xx-grid.run
-
Ignorare le avvertenze e fare clic su OK per continuare l'installazione. Eseguire il reboot del server.
sudo reboot
-
-
Rocky Linux 9
-
Copiare il driver Linux NVIDIA
NVIDIA-Linux-x86_64-xxx.xx.xx-grid.run
nell'istanza di computazione di cui è stato eseguito il provisioning. -
Installare le intestazioni Linux corrispondenti alla versione del kernel Linux.
sudo dnf install kernel-devel-$(uname -r)
-
Se non riesce a trovare le intestazioni Linux corrispondenti alla versione del kernel, aggiornare il kernel Linux e riavviare il server.
sudo dnf install kernel sudo reboot
Dopo il riavvio, reinstallare le intestazioni Linux in modo che corrispondano alla versione del kernel Linux.
sudo dnf install kernel-devel-$(uname -r)
-
Eseguire il comando seguente per verificare se è stato caricato il driver
nouveau
.lsmod | grep nouveau
-
Se nell'output del comando viene visualizzato il driver
nouveau
, sarà necessario prima disabilitarlo. Per disabilitare il drivernouveau
su Oracle Linux, creare il file/etc/modprobe.d/blacklist-nouveau.conf
e aggiungere il contenuto seguente.blacklist nouveau options nouveau modeset=0
-
Salvare il file e rigenerare initramfs.
sudo dracut --force
-
Dopo aver disabilitato il driver, riavviare il server.
sudo reboot
-
Eseguire il comando seguente per installare il driver NVIDIA vGPU.
sudo bash ./NVIDIA-Linux-x86_64-xxx.xxx.xx-grid.run
-
Ignorare le avvertenze e fare clic su OK per continuare l'installazione. Eseguire il reboot del server.
sudo reboot
-
-
Ubuntu 22
-
Copiare il driver Linux NVIDIA
NVIDIA-Linux-grid-xxx.xx.xx_amd64.deb
nell'istanza di computazione di cui è stato eseguito il provisioning. -
Eseguire il comando seguente per verificare se è stato caricato il driver
nouveau
.lsmod | grep nouveau
-
Se nell'output del comando viene visualizzato il driver
nouveau
, sarà necessario prima disabilitarlo. Per disabilitare il drivernouveau
su Oracle Linux, creare il file/etc/modprobe.d/blacklist-nouveau.conf
e aggiungere il contenuto seguente.blacklist nouveau options nouveau modeset=0
-
Salvare il file e rigenerare initramfs.
sudo dracut --force
-
Dopo aver disabilitato il driver, eseguire il reboot del server.
sudo reboot
-
Eseguire il comando seguente per installare il driver NVIDIA vGPU.
sudo apt install ./NVIDIA-Linux-grid-xxx.xxx.xx_amd64.deb
-
Eseguire il reboot del server.
sudo reboot
-
Task 4: verificare l'installazione del driver NVIDIA vGPU
-
Eseguire il comando
nvidia-smi
per verificare l'installazione del driver NVIDIA vGPU.
Task 5: abilitare la workstation virtuale NVIDIA RTX
-
Per abilitare la funzione NVIDIA RTX Virtual Workstation, aggiornare
edit /etc/nvidia/gridd.conf
.sudo vi /etc/nvidia/gridd.conf
-
Aggiungere una linea.
FeatureType=2
-
Salvare le modifiche e chiudere il file.
-
Controllare che il firmware GSP sia abilitato.
nvidia-smi -q | grep GSP
-
Se il firmware GSP è abilitato, il comando visualizza la versione del firmware GSP.
GSP Firmware Version : 525.85.05
-
Se il firmware GSP è abilitato, disabilitarlo impostando il parametro del modulo NVIDIA
NVreg_EnableGpuFirmware
su 0. Impostare questo parametro modificando il file/etc/modprobe.d/nvidia.conf
. Se il file/etc/modprobe.d/nvidia.conf
non esiste già, crearlo.sudo vi /etc/modprobe.d/nvidia.conf
Aggiungere la riga seguente (se non è già presente).
options nvidia NVreg_EnableGpuFirmware=0
-
Dopo aver disabilitato il GSP, è necessario riavviare il server.
sudo reboot
-
Scaricare il token di configurazione client da NVIDIA Licensing Portal o dall'appliance DLS. Per informazioni su come registrare la licenza NVIDIA vGPU, vedere Task 7: Register with NVIDIA vGPU Software License Server.
-
Copiare il token di configurazione del client nella posizione predefinita in
/etc/nvidia/ClientConfigToken
e impostare le autorizzazioni del file su 744.sudo chmod 744 /etc/nvidia/ClientConfigToken/client_configuration_token_*.tok
Nota: se si desidera memorizzare il token di configurazione client in una posizione personalizzata, copiare il token nella directory creata e impostare il parametro di configurazione
ClientConfigTokenPath
in/etc/nvidia/gridd.conf
in modo che punti a questa directory. -
Riavviare il servizio
nvidia-gridd
.sudo systemctl restart nvidia-gridd
-
Eseguire il comando
nvidia-smi -q
e verificare che Product Brand sia impostato su NVIDIA RTX e License Status mostra Licensed. -
Se non riesce a ottenere la licenza e mostra lo stato della licenza come Non concesso in licenza, controllare il log del servizio nvidia-gridd.
sudo grep gridd /var/log/messages
Task 6: Installa il driver NVIDIA vGPU su Windows
-
Copiare il pacchetto del driver NVIDIA Windows nella VM guest o nell'host fisico in cui si sta installando il driver. Eseguire il pacchetto per decomprimere ed eseguire il programma di installazione del driver. Accettare il contratto di licenza e selezionare Installazione rapida.
-
La VM GPU A10 OCI è configurata con passthrough GPU, pertanto è necessario impostare il comportamento del driver vGPU tramite regedit. Per ulteriori informazioni, vedere Virtual GPU Client Licensing User Guide.
-
Aggiungere il valore del registro
FeatureType DWord (REG_DWORD)
alla chiave del registro di Windows.HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\nvlddmkm\Global\GridLicensing
-
Impostare questo valore su 2 per abilitare la licenza NVIDIA RTX Virtual Workstation.
-
Riavviare il servizio NVIDIA Display Container LS.
-
Scaricare il token di configurazione client da NVIDIA Licensing Portal o dall'appliance DLS. Per informazioni su come registrare la licenza NVIDIA vGPU, vedere Task 7: Register with NVIDIA vGPU Software License Server.
-
Copiare il token di configurazione client nella cartella.
%SystemDrive%:\Program Files\NVIDIA Corporation\GRID Licensing\ClientConfigToken
-
Da una riga di comando o da PowerShell, eseguire il comando
nvidia-smi -q
e verificare che il brand del prodotto sia impostato su NVIDIA RTX e il stato della licenza mostra Licensed.Nota: in Windows,
nvidia-smi.exe
viene installato per impostazione predefinita nella cartellaC:\Program Files\NVIDIA Corporation\NVSMI
. -
Se non riesce a ottenere la licenza e Stato licenza viene visualizzato come Non concesso in licenza, controllare i messaggi di licenza nel log.
%SystemDrive%\Users\Public\Documents\NvidiaLogging\Log.NVDisplay.Container.exe.log
Task 7: Registra vGPUS con NVIDIA vGPU Software License Server
Le licenze vGPU vengono applicate tramite il software NVIDIA e le prestazioni della GPU virtuale vengono ridotte nel tempo se la VM non riesce a ottenere una licenza. A partire da vGPU versione 13.0, il sistema di licenze NVIDIA supporta i seguenti tipi di istanze di servizio:
-
Istanza Cloud License Service (CLS): un'istanza CLS viene ospitata nel portale NVIDIA Licensing.
-
Istanza DLS (Delegated License Service): un'istanza DLS viene ospitata in locale in una posizione accessibile dalla rete privata.
Puoi scaricare l'appliance virtuale DLS da NVIDIA Licensing Portal.
-
Andare a Download software, selezionare Download non driver e scaricare, impostare Platform su Linux KVM e scaricare la versione più recente di NLS License Server (DLS) ... per Linux KVM.
-
Estrarre il file e caricare il file QCOW2 dell'appliance virtuale DLS nello storage degli oggetti OCI. Successivamente, puoi importarlo in OCI come immagine personalizzata pseudo-virtualizzata e crearne una VM. In alternativa, è possibile eseguire l'appliance virtuale DLS come una delle VM nell'ambiente KVM.
- Per informazioni dettagliate su come ottenere e registrare la licenza NVIDIA vGPU e su come configurare il server delle licenze DLS, vedere NVIDIA License System User Guide e NVIDIA License System Quick Start Guide.
-
Una volta registrata la licenza vGPU con il server delle licenze software NVIDIA vGPU, è possibile confermare controllando Stato licenza nell'output del comando
nvidia-smi -q
.
Collegamenti correlati
Conferme
- Autore - Michael Prestin (Master Principal Cloud Architect)
Altre risorse di apprendimento
Esplora altri laboratori su docs.oracle.com/learn o accedi a più contenuti gratuiti sulla formazione su Oracle Learning YouTube channel. Inoltre, visita education.oracle.com/learning-explorer per diventare un Oracle Learning Explorer.
Per la documentazione del prodotto, visita l'Oracle Help Center.
Deploy NVIDIA RTX Virtual Workstation on Oracle Cloud Infrastructure
F80547-04
November 2024