Remarques :

Ce tutoriel nécessite un accès à Oracle Cloud. Pour vous inscrire à un compte gratuit, reportez-vous à Introduction au niveau gratuit d'Oracle Cloud Infrastructure.
Il utilise des exemples de valeurs pour les informations d'identification, la location et les compartiments Oracle Cloud Infrastructure. Lorsque vous terminez votre atelier, remplacez ces valeurs par celles propres à votre environnement cloud.

Déployer la station de travail virtuelle NVIDIA RTX sur Oracle Cloud Infrastructure

Introduction

Le logiciel NVIDIA RTX Virtual Workstation permet aux utilisateurs d'exécuter des simulations hautes performances, un rendu graphique et des charges de travail de conception sur le cloud, avec des performances natives de type poste de travail. Il déverrouille les puissantes fonctionnalités de rendu fournies par les API graphiques telles que OpenGL ou DirectX, ce qui apporte des performances graphiques révolutionnaires au cloud.

Objectif

Tirez parti de la technologie de GPU virtuel RTX et NVIDIA à l'aide de formes de calcul compatibles GPU NVIDIA A10 sur Oracle Cloud Infrastructure (OCI).

Tâche 1 : provisionnement d'une instance de calcul sur OCI pour la station de travail virtuelle NVIDIA RTX

Créez un réseau cloud virtuel (VCN) et lancez une instance de calcul sur OCI. Pour plus d'informations, reportez-vous à Création d'un VCN et à Lancement de l'instance Compute.
Sélectionnez-en une parmi les formes GPU.A10 disponibles.
```
VM.GPU.A10.1

VM.GPU.A10.2

BM.GPU.A10.4
```
Lors du lancement d'une instance de calcul, remplacez la forme par l'une des formes ci-dessus. Pour lancer la machine virtuelle GPU.A10, cliquez sur Spécialité et génération précédente, puis sélectionnez l'une des formes VM.GPU.A10. Pour les serveurs Bare Metal, cliquez sur Machines Bare Metal et sélectionnez la forme BM.GPU.A10.4.
Si votre location n'a pas de limite de service définie pour GPU.A10, ces formes ne figureront pas dans la liste des formes.
1. Pour vérifier les limites de location dans la console OCI, définissez la région dans laquelle vous allez provisionner une instance de calcul GPU.A10, ouvrez le menu de navigation et cliquez sur Gouvernance et administration.
2. Sous Gestion des locations, sélectionnez Limites, quotas et utilisation.
3. Définissez le service sur Compute, sélectionnez l'un des domaines de disponibilité dans la portée, puis entrez GPU.A10 dans la ressource.
4. Sélectionnez GPU pour les instances Bare Metal et de machine virtuelle basées sur A10.
Les limites de calcul sont applicables par domaine de disponibilité. Vérifiez si la limite est définie dans l'un des domaines de disponibilité de la région. Si la limite de service est définie sur 0 pour tous les domaines de disponibilité, cliquez sur Demander une augmentation de limite de service et soumettez une demande d'augmentation de limite pour cette ressource. Pour plus d'informations sur les limites de service, reportez-vous à Limites de service.

Remarque : pour accéder aux limites, aux quotas et à la utilisation, vous devez être membre du groupe d'administrateurs de location ou le groupe doit disposer d'une stratégie affectée pour lire LimitsAndUsageViewers.
Actuellement, les formes de calcul OCI GPU.A10 prennent en charge Oracle Linux, Ubuntu et Rocky Linux. Windows est pris en charge uniquement par les formes de machine virtuelle.

Remarque : Rocky Linux n'est pas officiellement pris en charge par NVIDIA.
Lors du provisionnement d'une instance de calcul sur OCI, utilisez une image de système d'exploitation standard. N'utilisez pas d'images compatibles GPU car le pilote NVIDIA GPU installé ne prend pas en charge la station de travail virtuelle RTX (vWS) qui nécessite l'installation du pilote NVIDIA vGPU.

Tâche 2 : téléchargement et installation du pilote NVIDIA vGPU

Téléchargez le pilote vGPU NVIDIA comme décrit dans la section Downloading NVIDIA vGPU software. Si vous ne disposez pas d'un compte d'entreprise avec NVIDIA, vous pouvez vous inscrire à l'essai sur Essai gratuit 90Days du logiciel de GPU virtuel (vGPU) - NVIDIA.
Connectez-vous au HUB de l'application NVIDIA Enterprise à l'aide de votre compte NVIDIA Enterprise.
Ouvrez le portail de licences NVIDIA et sélectionnez Téléchargements de logiciels. Appliquez les filtres suivants :
- Famille de produits : entrez VGPU.
- Plate-forme : entrez KVM Linux.
Triez par date de publication et téléchargez le package avec la dernière version du pilote vGPU pour la plate-forme KVM Linux. Par exemple, la dernière version de vGPU est actuellement 17.4.
Décompressez le fichier et accédez au dossier Guest_Drivers. Vous y trouverez les fichiers d'installation du pilote vGPU pour Windows et Linux.

Remarque : si vous utilisez Linux, suivez la tâche 3, 4, 5 et si vous utilisez Windows, accédez à la tâche 6.

Tâche 3 : installation du pilote NVIDIA vGPU sur Linux

Oracle Linux 8
1. Copiez le pilote NVIDIA Linux NVIDIA-Linux-x86_64-xxx.xx.xx-grid.run vers l'instance de calcul provisionnée.
2. Avant d'installer le pilote NVIDIA, installez et activez le jeu d'outils gcc-12 en exécutant la commande suivante.
```
sudo dnf install gcc-toolset-12
scl enable gcc-toolset-12 bash
```
3. Vous devrez également désactiver le pilote nouveau en conflit avec le pilote NVIDIA. Exécutez la commande suivante pour vérifier si le pilote nouveau est chargé.
```
lsmod | grep nouveau
```
4. S'il affiche le pilote nouveau dans la sortie de la commande, vous devez d'abord le désactiver. Pour désactiver le pilote nouveau sur Oracle Linux, créez le fichier /etc/modprobe.d/blacklist-nouveau.conf et ajoutez le contenu suivant.
```
blacklist nouveau

options nouveau modeset=0
```
5. Enregistrez le fichier et régénérez initramfs.
```
sudo dracut --force
```
6. Après avoir désactivé le pilote, réinitialisez le serveur.
```
sudo reboot
```
7. Exécutez la commande suivante pour installer le pilote NVIDIA vGPU.
```
sudo bash ./NVIDIA-Linux-x86_64-xxx.xxx.xx-grid.run
```
8. Ignorez les avertissements et cliquez sur OK pour poursuivre l'installation. Réinitialisez le serveur.
```
sudo reboot
```
Oracle Linux 9
1. Copiez le pilote NVIDIA Linux NVIDIA-Linux-x86_64-xxx.xx.xx-grid.run vers l'instance de calcul provisionnée.
2. Vous devrez également désactiver le pilote nouveau en conflit avec le pilote NVIDIA. Exécutez la commande suivante pour vérifier si le pilote nouveau est chargé.
```
lsmod | grep nouveau
```
3. S'il affiche le pilote nouveau dans la sortie de la commande, vous devez d'abord le désactiver. Pour désactiver le pilote nouveau sur Oracle Linux, créez le fichier /etc/modprobe.d/blacklist-nouveau.conf et ajoutez le contenu suivant.
```
blacklist nouveau

options nouveau modeset=0
```
4. Enregistrez le fichier et régénérez initramfs.
```
sudo dracut --force
```
5. Après avoir désactivé le pilote, réinitialisez le serveur.
```
sudo reboot
```
6. Exécutez la commande suivante pour installer le pilote NVIDIA vGPU.
```
sudo bash ./NVIDIA-Linux-x86_64-xxx.xxx.xx-grid.run
```
7. Ignorez les avertissements et cliquez sur OK pour poursuivre l'installation. Réinitialisez le serveur.
```
sudo reboot
```
Rocky Linux 9
1. Copiez le pilote NVIDIA Linux NVIDIA-Linux-x86_64-xxx.xx.xx-grid.run vers l'instance de calcul provisionnée.
2. Installez les en-têtes Linux correspondant à la version du noyau Linux.
```
sudo dnf install kernel-devel-$(uname -r)
```
3. S'il ne parvient pas à trouver les en-têtes Linux correspondant à la version du noyau, mettez à niveau le noyau Linux et réinitialisez le serveur.
```
sudo dnf install kernel

sudo reboot
```
  Après la réinitialisation, réinstallez les en-têtes Linux pour qu'ils correspondent à la version du noyau Linux.
```
sudo dnf install kernel-devel-$(uname -r)
```
4. Exécutez la commande suivante pour vérifier si le pilote nouveau est chargé.
```
lsmod | grep nouveau
```
5. S'il affiche le pilote nouveau dans la sortie de la commande, vous devez d'abord le désactiver. Pour désactiver le pilote nouveau sur Oracle Linux, créez le fichier /etc/modprobe.d/blacklist-nouveau.conf et ajoutez le contenu suivant.
```
blacklist nouveau

options nouveau modeset=0
```
6. Enregistrez le fichier et régénérez initramfs.
```
sudo dracut --force
```
7. Après avoir désactivé le pilote, réinitialisez le serveur.
```
sudo reboot
```
8. Exécutez la commande suivante pour installer le pilote NVIDIA vGPU.
```
sudo bash ./NVIDIA-Linux-x86_64-xxx.xxx.xx-grid.run
```
9. Ignorez les avertissements et cliquez sur OK pour poursuivre l'installation. Réinitialisez le serveur.
```
sudo reboot
```
Ubuntu 22
1. Copiez le pilote NVIDIA Linux NVIDIA-Linux-grid-xxx.xx.xx_amd64.deb vers l'instance de calcul provisionnée.
2. Exécutez la commande suivante pour vérifier si le pilote nouveau est chargé.
```
lsmod | grep nouveau
```
3. S'il affiche le pilote nouveau dans la sortie de la commande, vous devez d'abord le désactiver. Pour désactiver le pilote nouveau sur Oracle Linux, créez le fichier /etc/modprobe.d/blacklist-nouveau.conf et ajoutez le contenu suivant.
```
blacklist nouveau

options nouveau modeset=0
```
4. Enregistrez le fichier et régénérez initramfs.
```
sudo dracut --force
```
5. Après avoir désactivé le pilote, réinitialisez le serveur.
```
sudo reboot
```
6. Exécutez la commande suivante pour installer le pilote NVIDIA vGPU.
```
sudo apt install ./NVIDIA-Linux-grid-xxx.xxx.xx_amd64.deb
```
7. Réinitialisez le serveur.
```
sudo reboot
```

Tâche 4 : vérifier l'installation du pilote NVIDIA vGPU

Exécutez la commande nvidia-smi pour vérifier l'installation du pilote NVIDIA vGPU.

Tâche 5 : activation de la station de travail virtuelle NVIDIA RTX

Pour activer la fonction NVIDIA RTX Virtual Workstation, mettez à jour edit /etc/nvidia/gridd.conf.
```
sudo vi /etc/nvidia/gridd.conf
```
Ajoutez une ligne.
```
FeatureType=2
```
Enregistrez les modifications et fermez le fichier.
Vérifiez si le microprogramme GSP est activé.
```
nvidia-smi -q | grep GSP
```
Si le microprogramme GSP est activé, la commande affiche la version du microprogramme GSP.
```
GSP Firmware Version                  : 525.85.05
```
Si le microprogramme GSP est activé, désactivez-le en définissant le paramètre de module NVIDIA NVreg_EnableGpuFirmware sur 0. Définissez ce paramètre en modifiant le fichier /etc/modprobe.d/nvidia.conf. Si le fichier /etc/modprobe.d/nvidia.conf n'existe pas déjà, créez-le.
```
sudo vi /etc/modprobe.d/nvidia.conf
```
Ajoutez la ligne suivante (si vous ne l'avez pas déjà).
```
options nvidia NVreg_EnableGpuFirmware=0
```
Après avoir désactivé le SPG, vous devez réinitialiser le serveur.
```
sudo reboot
```
Téléchargez le jeton de configuration client à partir du portail de licences NVIDIA ou de l'appareil DLS. Pour plus d'informations sur l'enregistrement de la licence vGPU NVIDIA, reportez-vous à Tâche 7 : inscription auprès du serveur de licence logicielle NVIDIA vGPU.
Copiez le jeton de configuration client à l'emplacement par défaut dans /etc/nvidia/ClientConfigToken et définissez les droits d'accès au fichier sur 744.
```
sudo chmod 744 /etc/nvidia/ClientConfigToken/client_configuration_token_*.tok
```
Remarque : si vous voulez stocker le jeton de configuration client dans un emplacement personnalisé, copiez le jeton dans le répertoire que vous avez créé et définissez le paramètre de configuration ClientConfigTokenPath dans /etc/nvidia/gridd.conf pour qu'il pointe vers ce répertoire.
Redémarrez le service nvidia-gridd.
```
sudo systemctl restart nvidia-gridd
```
Exécutez la commande nvidia-smi -q et vérifiez que la marque du produit est définie sur NVIDIA RTX et que License Status indique Licensed.
S'il ne parvient pas à obtenir la licence et affiche License Status comme Unlicensed, consultez le journal du service nvidia-gridd.
```
sudo grep gridd /var/log/messages
```

Tâche 6 : installation du pilote NVIDIA vGPU sous Windows

Copiez le package du pilote NVIDIA Windows sur la machine virtuelle invitée ou l'hôte physique sur lequel vous installez le pilote. Exécutez le package pour décompresser et exécuter le programme d'installation du pilote. Acceptez le contrat de licence et sélectionnez Installation express.
La machine virtuelle de GPU OCI A10 est configurée avec un passthrough de GPU. Par conséquent, vous devez définir le comportement du pilote vGPU via regedit. Pour plus d'informations, reportez-vous au Guide de l'utilisateur Virtual GPU Client Licensing.
Ajoutez la valeur de registre FeatureType DWord (REG_DWORD) à la clé de registre Windows.
```
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\nvlddmkm\Global\GridLicensing
```
Définissez cette valeur sur 2 pour activer la licence de station de travail virtuelle NVIDIA RTX.
Redémarrez le service NVIDIA Display Container LS.
Téléchargez le jeton de configuration client à partir du portail de licences NVIDIA ou de l'appareil DLS. Pour plus d'informations sur l'enregistrement de la licence vGPU NVIDIA, reportez-vous à Tâche 7 : inscription auprès du serveur de licence logicielle NVIDIA vGPU.

Copiez le jeton de configuration client dans le dossier.

%SystemDrive%:\Program Files\NVIDIA Corporation\GRID Licensing\ClientConfigToken

A partir d'une ligne de commande ou de PowerShell, exécutez la commande nvidia-smi -q et vérifiez que la marque du produit est définie sur NVIDIA RTX et que License Status indique Licensed.

Remarque : sous Windows, nvidia-smi.exe est installé par défaut dans le dossier C:\Program Files\NVIDIA Corporation\NVSMI.
S'il ne parvient pas à obtenir la licence et affiche Statut de licence comme Non concédé sous licence, consultez les messages de licence dans le journal.
```
%SystemDrive%\Users\Public\Documents\NvidiaLogging\Log.NVDisplay.Container.exe.log
```

Tâche 7 : enregistrer vGPUS auprès du serveur de licence logicielle NVIDIA vGPU

Les licences vGPU sont appliquées via le logiciel NVIDIA et les performances du GPU virtuel sont dégradées au fil du temps si la machine virtuelle ne parvient pas à obtenir de licence. A partir de la version 13.0 de vGPU, le système de licences NVIDIA prend en charge les types d'instance de service suivants :

Instance Cloud License Service (CLS) : une instance CLS est hébergée sur le portail de licence NVIDIA.
Instance de service de licence déléguée (DLS) : une instance DLS est hébergée sur site à un emplacement accessible à partir de votre réseau privé.

Vous pouvez télécharger l'appliance virtuelle DLS à partir du portail de licences NVIDIA.

Accédez à Téléchargements de logiciels, sélectionnez Téléchargements sans pilote et téléchargez, définissez Plate-forme sur Linux KVM et téléchargez la dernière version de NLS License Server (DLS) ... pour Linux KVM.
Décompressez le fichier et téléchargez le fichier QCOW2 de l'appliance virtuelle DLS vers OCI Object Storage. Vous pouvez ensuite l'importer dans OCI en tant qu'image personnalisée paravirtualisée et en créer une machine virtuelle. Vous pouvez également exécuter l'appliance virtuelle DLS en tant que machine virtuelle dans l'environnement KVM.
- Pour plus d'informations sur l'obtention et l'enregistrement de la licence vGPU NVIDIA et sur la configuration du serveur de licences DLS, reportez-vous au Guide de l'utilisateur du système de licences NVIDIA et au Guide de démarrage rapide du système de licences NVIDIA.
Une fois la licence vGPU enregistrée auprès du serveur de licence du logiciel vGPU NVIDIA, vous pouvez la confirmer en vérifiant Statut de la licence dans la sortie de la commande nvidia-smi -q.

Remerciements

Auteur - Michael Prestin (architecte cloud principal)

Ressources de formation supplémentaires

Explorez d'autres ateliers sur docs.oracle.com/learn ou accédez à d'autres contenus de formation gratuits sur le canal Oracle Learning YouTube. De plus, visitez le site education.oracle.com/learning-explorer pour devenir un explorateur Oracle Learning.

Pour obtenir la documentation produit, consultez le site Oracle Help Center.

Informations relatives au titre et au copyright

Deploy NVIDIA RTX Virtual Workstation on Oracle Cloud Infrastructure

F80546-04

November 2024

Oracle et/ou ses affiliés.