Configuración de rack de expansión de GPU

Private Cloud Appliance con expansión de GPU proporciona una plataforma escalable para crear aplicaciones con uso intensivo de IA y gráficos en el entorno de nube privada.

Está diseñado para impulsar la próxima generación de cargas de trabajo de centros de datos, que incluyen:

Inferencia de IA generativa: inferencias en tiempo real para pipelines de IA generativa multimodelo (texto, imagen, audio, video)
Entrenamiento y ajuste de LLM: rendimiento acelerado para ajustar LLM medianos y entrenar pequeños LLM con el motor de transformadores de NVIDIA y soporte FP8
Aplicaciones VDI y con uso intensivo de gráficos: 3D gráficos y flujos de trabajo de renderizado con las capacidades de RTX y rastreo de rayos de NVIDIA
Gemelos digitales con NVIDIA Omniverse: desarrolla y opera complejos flujos de trabajo de digitalización industrial 3D
Transmisión de medios: aumento de la densidad de codificación / decodificación y soporte AV1 para la transmisión de video 4K
HPC: análisis de datos científicos y cargas de trabajo de simulación con soporte FP32

Las ampliaciones de GPU requieren la versión de software del dispositivo 3.0.2-b1325160 (marzo de 2025) o posterior. Un rack de expansión de GPU X10-2c contiene de 1 a 6 nodos de servidor de cálculo L40S de GPU X10-2c. Para integrarse con la infraestructura de red física del bastidor base, se instalan dos switches de interconexión de módulos Cisco Nexus 9336C-FX2 y un switch de gestión Cisco Nexus 9348GC-FXP. Este rack no incluye hardware de almacenamiento.

Configuración de rack de GPU X10-2c

La configuración mínima agrega 1 nodo de expansión de GPU instalado de fábrica. Se pueden instalar más nodos en la fábrica o después del despliegue. El cableado está preinstalado para una configuración de rack completa, independientemente del número de nodos instalados de fábrica. Un único rack de expansión contiene hasta 6 nodos de GPU. Se pueden conectar dos racks de expansión al rack base para un máximo de 12 nodos de GPU.

Figura en la que se muestran los componentes instalados en un rack de expansión de GPU.


Llamada	Cantidad	Descripción
A	6	Nodo de GPU configuración mínima: 1, rack máximo: 6
B	1	relleno del cepillo - permite el enrutamiento del cable desde la parte posterior a los conectores en la parte delantera
C	1	conmutador de gestión
D	2	Unidad de distribución de energía universal (UPDU)
E	2	switch de interconexión de módulos
(ninguno)	18	el panel del relleno instalado en las 12 unidades de rack superiores y en espacios vacíos entre los componentes

Documentación de Oracle Cloud Infrastructure

Configuración de rack de expansión de GPU