Unidades informáticas
Una unidad es una plantilla que determina el tipo y la cantidad de recursos asignados a una instancia informática. Compute Cloud@Customer ofrece una opción entre una unidad flexible para cargas de trabajo genéricas y unidades dedicadas para cargas de trabajo aceleradas por GPU.
Seleccione la configuración de unidad al crear una instancia. Consulte Creación de una instancia.
Puede utilizar las siguientes unidades para instancias que se crean en Compute Cloud@Customer:
- Unidad flexible: seleccione el número de OCPU y la cantidad de memoria que se asignan a una instancia.
- Unidades de GPU: cada unidad tiene un número fijo de OCPU, memoria y GPU que se asignan a una instancia al crear la instancia.
Unidad flexible
Al crear instancias mediante cualquiera de las imágenes de plataforma que se proporcionan con Compute Cloud@Customer, todas las cargas de trabajo comunes se pueden manejar con VM.PCAStandard.E5. Unidad flexible. Debido a que es una unidad flexible, permite personalizar el número de OCPU y la cantidad de memoria de cada instancia. Puede optimizar el rendimiento de la instancia para una carga de trabajo específica y asegurarse de que los recursos se utilizan de forma eficiente.
En la siguiente tabla se muestra el número de OCPU y la cantidad de memoria que puede configurar mediante VM.PCAStandard.E5. Unidad flexible.
El número de OCPU que seleccione determina el máximo de asociaciones de VNIC y el ancho de banda de red para la instancia.
Especificación | Posibles Valores |
---|---|
Nombre de unidad | VM.PCAStandard.E5. Flexible |
OCPU, mínimo - máximo | De 1 en 96 |
Memoria, valor por defecto | 10 GB por OCPU |
Memoria, mínimo | 1 GB por OCPU |
Memoria, máximo | 64 GB por OCPU, hasta 960 GB |
VNIC, máximo |
|
ancho de banda, máximo |
|
En la siguiente tabla, se muestra cómo funcionan las propiedades de VM.PCAStandard.E5. La unidad flexible se puede optimizar para cada instancia individual.
OCPU seleccionadas | Posible rango de memoria (GB) | VNIC máximas | Ancho de banda máximo (Gbps) |
---|---|---|---|
4 | De 4 en 256 | 4 | 24,6 |
20 | De 20 en 960 | 20 | 24,6 |
30 | De 30 en 960 | 24 | 30 |
96 | De 96 en 960 | 24 | 40 |
Unidades de GPU
Las unidades de máquina virtual de GPU están optimizadas para cargas de trabajo empresariales aceleradas por GPU. Solo se pueden utilizar si el despliegue de Compute Cloud@Customer incluye un rack de expansión de GPU. Las instancias creadas con una unidad de GPU tienen acceso directo (passthrough) a 1-4 GPU físicas. El ratio entre las GPU, las OCPU y la memoria es fijo.
Para cargas de trabajo aceleradas por GPU, puede elegir entre estas unidades: VM.GPU.L40S.1, VM.GPU.L40S.2,VM.GPU.L40S.3, VM.GPU.L40S.4. Para acceder a estas unidades dedicadas, debe crear una instancia basada en la imagen de plataforma de Oracle Linux 8 u Oracle Linux 9.
No se incluye ningún controlador de GPU en las imágenes actuales de la plataforma Oracle Linux. El sistema operativo de la instancia detecta las GPU asignadas, pero para utilizarlas, necesita el kit de herramientas CUDA del sitio para desarrolladores de NVIDIA para instalar los controladores necesarios.
La gran descarga y la instalación del repositorio local necesitan una gran cantidad de espacio en disco. El volumen de inicio por defecto de 50 GB es insuficiente en Oracle Linux 9 y solo es lo suficientemente grande en Oracle Linux 8. Se recomienda aumentar el tamaño del volumen de inicio a, al menos, 60 GB y ampliar el sistema de archivos según corresponda.
-
Desde la línea de comandos de la instancia, descargue e instale el rpm de CUDA Toolkit para su sistema operativo.
$ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo rpm -i cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo dnf clean all $ sudo dnf install cuda-toolkit-12-8
-
Active el repositorio yum de Oracle Linux 9 EPEL. Instale el paquete
dkms
.$ sudo yum-config-manager --enable ol9_developer_EPEL $ sudo dnf install dkms
-
Instale los controladores de GPU.
$ sudo dnf install cuda-12-8
-
Verifique la instalación con la interfaz de gestión del sistema NVIDIA.
$ nvidia-smi +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 570.86.10 Driver Version: 570.86.10 CUDA Version: 12.8 | |-----------------------------------------+------------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA L40S Off | 00000000:00:05.0 Off | 0 | | N/A 26C P8 23W / 350W | 1MiB / 46068MiB | 0% Default | | | | N/A | +-----------------------------------------+------------------------+----------------------+ +-----------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=========================================================================================| | No running processes found | +-----------------------------------------------------------------------------------------+
-
Desde la línea de comandos de la instancia, descargue e instale el rpm de CUDA Toolkit para su sistema operativo.
$ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo rpm -i cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo dnf clean all $ sudo dnf install cuda-toolkit-12-8
-
Active el repositorio yum de Oracle Linux 8 EPEL. Instale el paquete
dkms
.$ sudo yum-config-manager --enable ol8_developer_EPEL $ sudo dnf install dkms
-
Instale los controladores de GPU.
$ sudo dnf install cuda-12-8
-
Instale el módulo de núcleo NVIDIA.
$ sudo scl enable gcc-toolset-13 bash # dkms install nvidia-open -v 570.86.10
Si aparece este error
make
mientras se crea el módulo de núcleo, puede ignorarlo sin problemas.Cleaning build area...(bad exit status: 2) Failed command: make -C /lib/modules/5.15.0-206.153.7.el8uek.x86_64/build M=/var/lib/dkms/nvidia-open/570.86.10/build clean
-
Verifique la instalación con la interfaz de gestión del sistema NVIDIA.
# nvidia-smi +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 570.86.10 Driver Version: 570.86.10 CUDA Version: 12.8 | |-----------------------------------------+------------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA L40S Off | 00000000:00:05.0 Off | 0 | | N/A 26C P8 23W / 350W | 1MiB / 46068MiB | 0% Default | | | | N/A | +-----------------------------------------+------------------------+----------------------+ +-----------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=========================================================================================| | No running processes found | +-----------------------------------------------------------------------------------------+
Especificación | Posibles Valores |
---|---|
Nombre de unidad |
|
GPU | 1-4: corresponde con el nombre de la unidad |
OCPU | 27 por GPU |
Memoria | 200 GB por GPU |
VNICs | Se devolverán hasta 24 |
ancho de banda | Hasta 400 Gbps |