Pilotes de processeur graphique non inclus dans les images de plate-forme Oracle Linux

Les images de plate-forme Oracle Linux 8 ou Oracle Linux 9 fournies avec Compute Cloud@Customer n'incluent pas de pilotes GPU. Si vous créez une instance GPU, vous devez installer manuellement les pilotes GPU.

Détails

Si une installation de Compute Cloud@Customer inclut des noeuds de calcul avec GPU, vous pouvez y accéder en sélectionnant une forme dédiée. Les formes GPU peuvent être sélectionnées pour des instances de calcul basées sur une image de plate-forme Oracle Linux 8 ou Oracle Linux 9. Les versions d'image actuelles n'incluent pas de pilotes GPU. Le système d'exploitation de l'instance détecte les processeurs graphiques affectés, mais pour les utiliser, vous avez besoin de la boîte à outils CUDA du site de développeurs NVIDIA pour installer les pilotes requis.

Note

Le téléchargement volumineux et l'installation du référentiel local nécessitent beaucoup d'espace disque. Le volume de démarrage par défaut de 50 Go est insuffisant sur Oracle Linux 9 et seulement assez grand sur Oracle Linux 8. Il est fortement recommandé d'augmenter la taille du volume de démarrage à au moins 60 Go et d'étendre le système de fichiers en conséquence.

Solution de rechange

Après avoir créé l'instance, connectez-vous à l'instance et installez la boîte à outils CUDA. Suivez les instructions relatives à votre version d'Oracle Linux.

Installation des pilotes GPU dans une instance Oracle Linux 9
  1. À partir de la ligne de commande de l'instance, téléchargez et installez le rpm CUDA Toolkit pour votre système d'exploitation.

    $ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo rpm -i cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo dnf clean all
    $ sudo dnf install cuda-toolkit-12-8
  2. Activer le référentiel yum EPEL pour Oracle Linux 9. Installez l'ensemble dkms.

    $ sudo yum-config-manager --enable ol9_developer_EPEL
    $ sudo dnf install dkms
  3. Installez les pilotes GPU.

    $ sudo dnf install cuda-12-8
  4. Vérifiez l'installation avec l'interface de gestion de système NVIDIA.

    $ nvidia-smi
    +-----------------------------------------------------------------------------------------+
    | NVIDIA-SMI 570.86.10              Driver Version: 570.86.10      CUDA Version: 12.8     |
    |-----------------------------------------+------------------------+----------------------+
    | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
    |                                         |                        |               MIG M. |
    |=========================================+========================+======================|
    |   0  NVIDIA L40S                    Off |   00000000:00:05.0 Off |                    0 |
    | N/A   26C    P8             23W /  350W |       1MiB /  46068MiB |      0%      Default |
    |                                         |                        |                  N/A |
    +-----------------------------------------+------------------------+----------------------+
    
    +-----------------------------------------------------------------------------------------+
    | Processes:                                                                              |
    |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
    |        ID   ID                                                               Usage      |
    |=========================================================================================|
    |  No running processes found                                                             |
    +-----------------------------------------------------------------------------------------+
Installation des pilotes GPU dans une instance Oracle Linux 8
  1. À partir de la ligne de commande de l'instance, téléchargez et installez le rpm CUDA Toolkit pour votre système d'exploitation.

    $ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo rpm -i cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo dnf clean all
    $ sudo dnf install cuda-toolkit-12-8
  2. Activer le référentiel yum EPEL pour Oracle Linux 8. Installez l'ensemble dkms.

    $ sudo yum-config-manager --enable ol8_developer_EPEL
    $ sudo dnf install dkms
  3. Installez les pilotes GPU.

    $ sudo dnf install cuda-12-8
  4. Installez le module de noyau NVIDIA.

    $ sudo scl enable gcc-toolset-13 bash
    # dkms install nvidia-open -v 570.86.10

    Si cette erreur make s'affiche pendant la création du module de noyau, vous pouvez l'ignorer en toute sécurité.

    Cleaning build area...(bad exit status: 2)
    Failed command:
    make -C /lib/modules/5.15.0-206.153.7.el8uek.x86_64/build M=/var/lib/dkms/nvidia-open/570.86.10/build clean
  5. Vérifiez l'installation avec l'interface de gestion de système NVIDIA.

    # nvidia-smi
    +-----------------------------------------------------------------------------------------+
    | NVIDIA-SMI 570.86.10              Driver Version: 570.86.10      CUDA Version: 12.8     |
    |-----------------------------------------+------------------------+----------------------+
    | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
    |                                         |                        |               MIG M. |
    |=========================================+========================+======================|
    |   0  NVIDIA L40S                    Off |   00000000:00:05.0 Off |                    0 |
    | N/A   26C    P8             23W /  350W |       1MiB /  46068MiB |      0%      Default |
    |                                         |                        |                  N/A |
    +-----------------------------------------+------------------------+----------------------+
    
    +-----------------------------------------------------------------------------------------+
    | Processes:                                                                              |
    |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
    |        ID   ID                                                               Usage      |
    |=========================================================================================|
    |  No running processes found                                                             |
    +-----------------------------------------------------------------------------------------+