Pilotes de processeur graphique non inclus dans les images de plate-forme Oracle Linux
Les images de plate-forme Oracle Linux 8 ou Oracle Linux 9 fournies avec Compute Cloud@Customer n'incluent pas de pilotes GPU. Si vous créez une instance GPU, vous devez installer manuellement les pilotes GPU.
- Détails
-
Si une installation de Compute Cloud@Customer inclut des noeuds de calcul avec GPU, vous pouvez y accéder en sélectionnant une forme dédiée. Les formes GPU peuvent être sélectionnées pour des instances de calcul basées sur une image de plate-forme Oracle Linux 8 ou Oracle Linux 9. Les versions d'image actuelles n'incluent pas de pilotes GPU. Le système d'exploitation de l'instance détecte les processeurs graphiques affectés, mais pour les utiliser, vous avez besoin de la boîte à outils CUDA du site de développeurs NVIDIA pour installer les pilotes requis.
Note
Le téléchargement volumineux et l'installation du référentiel local nécessitent beaucoup d'espace disque. Le volume de démarrage par défaut de 50 Go est insuffisant sur Oracle Linux 9 et seulement assez grand sur Oracle Linux 8. Il est fortement recommandé d'augmenter la taille du volume de démarrage à au moins 60 Go et d'étendre le système de fichiers en conséquence.
- Solution de rechange
-
Après avoir créé l'instance, connectez-vous à l'instance et installez la boîte à outils CUDA. Suivez les instructions relatives à votre version d'Oracle Linux.
Installation des pilotes GPU dans une instance Oracle Linux 9-
À partir de la ligne de commande de l'instance, téléchargez et installez le rpm CUDA Toolkit pour votre système d'exploitation.
$ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo rpm -i cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo dnf clean all $ sudo dnf install cuda-toolkit-12-8 -
Activer le référentiel yum EPEL pour Oracle Linux 9. Installez l'ensemble
dkms.$ sudo yum-config-manager --enable ol9_developer_EPEL $ sudo dnf install dkms -
Installez les pilotes GPU.
$ sudo dnf install cuda-12-8 -
Vérifiez l'installation avec l'interface de gestion de système NVIDIA.
$ nvidia-smi +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 570.86.10 Driver Version: 570.86.10 CUDA Version: 12.8 | |-----------------------------------------+------------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA L40S Off | 00000000:00:05.0 Off | 0 | | N/A 26C P8 23W / 350W | 1MiB / 46068MiB | 0% Default | | | | N/A | +-----------------------------------------+------------------------+----------------------+ +-----------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=========================================================================================| | No running processes found | +-----------------------------------------------------------------------------------------+
Installation des pilotes GPU dans une instance Oracle Linux 8-
À partir de la ligne de commande de l'instance, téléchargez et installez le rpm CUDA Toolkit pour votre système d'exploitation.
$ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo rpm -i cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo dnf clean all $ sudo dnf install cuda-toolkit-12-8 -
Activer le référentiel yum EPEL pour Oracle Linux 8. Installez l'ensemble
dkms.$ sudo yum-config-manager --enable ol8_developer_EPEL $ sudo dnf install dkms -
Installez les pilotes GPU.
$ sudo dnf install cuda-12-8 -
Installez le module de noyau NVIDIA.
$ sudo scl enable gcc-toolset-13 bash # dkms install nvidia-open -v 570.86.10Si cette erreur
makes'affiche pendant la création du module de noyau, vous pouvez l'ignorer en toute sécurité.Cleaning build area...(bad exit status: 2) Failed command: make -C /lib/modules/5.15.0-206.153.7.el8uek.x86_64/build M=/var/lib/dkms/nvidia-open/570.86.10/build clean -
Vérifiez l'installation avec l'interface de gestion de système NVIDIA.
# nvidia-smi +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 570.86.10 Driver Version: 570.86.10 CUDA Version: 12.8 | |-----------------------------------------+------------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA L40S Off | 00000000:00:05.0 Off | 0 | | N/A 26C P8 23W / 350W | 1MiB / 46068MiB | 0% Default | | | | N/A | +-----------------------------------------+------------------------+----------------------+ +-----------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=========================================================================================| | No running processes found | +-----------------------------------------------------------------------------------------+
-