GPU-Treiber, die nicht in Oracle Linux-Plattformimages enthalten sind
Die mit Compute Cloud@Customer bereitgestellten Oracle Linux 8- oder Oracle Linux 9-Plattformimages enthalten keine GPU-Treiber. Wenn Sie eine GPU-Instanz erstellen, müssen Sie die GPU-Treiber manuell installieren.
- Details
-
Wenn eine Compute Cloud@Customer-Installation Compute Nodes mit GPUs enthält, können Sie auf diese zugreifen, indem Sie eine dedizierte Ausprägung auswählen. Die GPU-Ausprägungen können für Compute-Instanzen basierend auf einem Oracle Linux 8- oder Oracle Linux 9-Plattformimage ausgewählt werden. Die aktuellen Imageversionen enthalten keine GPU-Treiber. Das Instanz-BS erkennt die zugewiesenen GPUs. Um diese zu verwenden, benötigen Sie jedoch das CUDA-Toolkit von der NVIDIA-Entwicklersite, um die erforderlichen Treiber zu installieren.
Hinweis
Die Installation des großen Downloads und des lokalen Repositorys erfordert viel Festplattenspeicher. Das standardmäßige 50-GB-Boot-Volume ist bei Oracle Linux 9 nicht ausreichend und bei Oracle Linux 8 nur ausreichend groß. Es wird dringend empfohlen, die Boot-Volume-Größe auf mindestens 60 GB zu erhöhen und das Dateisystem entsprechend zu erweitern.
- Workaround
-
Melden Sie sich nach dem Erstellen der Instanz bei der Instanz an, und installieren Sie das CUDA Toolkit. Befolgen Sie die Anweisungen für Ihre Oracle Linux-Version.
GPU-Treiber in einer Oracle Linux 9-Instanz installieren-
Laden Sie in der Befehlszeile der Instanz die CUDA Toolkit rpm für Ihr BS herunter, und installieren Sie sie.
$ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo rpm -i cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo dnf clean all $ sudo dnf install cuda-toolkit-12-8
-
Aktivieren Sie das yum-Repository für Oracle Linux 9 EPEL. Installieren Sie das Package
dkms
.$ sudo yum-config-manager --enable ol9_developer_EPEL $ sudo dnf install dkms
-
Installieren Sie GPU-Treiber.
$ sudo dnf install cuda-12-8
-
Prüfen Sie die Installation mit der NVIDIA System Management Interface.
$ nvidia-smi +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 570.86.10 Driver Version: 570.86.10 CUDA Version: 12.8 | |-----------------------------------------+------------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA L40S Off | 00000000:00:05.0 Off | 0 | | N/A 26C P8 23W / 350W | 1MiB / 46068MiB | 0% Default | | | | N/A | +-----------------------------------------+------------------------+----------------------+ +-----------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=========================================================================================| | No running processes found | +-----------------------------------------------------------------------------------------+
GPU-Treiber in einer Oracle Linux 8-Instanz installieren-
Laden Sie in der Befehlszeile der Instanz die CUDA Toolkit rpm für Ihr BS herunter, und installieren Sie sie.
$ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo rpm -i cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo dnf clean all $ sudo dnf install cuda-toolkit-12-8
-
Aktivieren Sie das yum-Repository für Oracle Linux 8 EPEL. Installieren Sie das Package
dkms
.$ sudo yum-config-manager --enable ol8_developer_EPEL $ sudo dnf install dkms
-
Installieren Sie GPU-Treiber.
$ sudo dnf install cuda-12-8
-
Installieren Sie das NVIDIA Kernel-Modul.
$ sudo scl enable gcc-toolset-13 bash # dkms install nvidia-open -v 570.86.10
Wenn dieser
make
-Fehler angezeigt wird, während das Kernelmodul erstellt wird, können Sie ihn problemlos ignorieren.Cleaning build area...(bad exit status: 2) Failed command: make -C /lib/modules/5.15.0-206.153.7.el8uek.x86_64/build M=/var/lib/dkms/nvidia-open/570.86.10/build clean
-
Prüfen Sie die Installation mit der NVIDIA System Management Interface.
# nvidia-smi +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 570.86.10 Driver Version: 570.86.10 CUDA Version: 12.8 | |-----------------------------------------+------------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA L40S Off | 00000000:00:05.0 Off | 0 | | N/A 26C P8 23W / 350W | 1MiB / 46068MiB | 0% Default | | | | N/A | +-----------------------------------------+------------------------+----------------------+ +-----------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=========================================================================================| | No running processes found | +-----------------------------------------------------------------------------------------+
-