Configuración de rack de expansión de GPU
Private Cloud Appliance con expansión de GPU proporciona una plataforma escalable para crear aplicaciones con uso intensivo de IA y gráficos en el entorno de nube privada.
Está diseñado para impulsar la próxima generación de cargas de trabajo de centros de datos, que incluyen:
-
Inferencia de IA generativa: inferencias en tiempo real para pipelines de IA generativa multimodelo (texto, imagen, audio, video)
-
Entrenamiento y ajuste de LLM: rendimiento acelerado para ajustar LLM medianos y entrenar pequeños LLM con el motor de transformadores de NVIDIA y soporte FP8
-
Aplicaciones VDI y con uso intensivo de gráficos: 3D gráficos y flujos de trabajo de renderizado con las capacidades de RTX y rastreo de rayos de NVIDIA
-
Gemelos digitales con NVIDIA Omniverse: desarrolla y opera complejos flujos de trabajo de digitalización industrial 3D
-
Transmisión de medios: aumento de la densidad de codificación / decodificación y soporte AV1 para la transmisión de video 4K
-
HPC: análisis de datos científicos y cargas de trabajo de simulación con soporte FP32
Las ampliaciones de GPU requieren la versión de software del dispositivo 3.0.2-b1325160 (marzo de 2025) o posterior. Un rack de expansión de GPU X10-2c contiene de 1 a 6 nodos de servidor de cálculo L40S de GPU X10-2c. Para integrarse con la infraestructura de red física del bastidor base, se instalan dos switches de interconexión de módulos Cisco Nexus 9336C-FX2 y un switch de gestión Cisco Nexus 9348GC-FXP. Este rack no incluye hardware de almacenamiento.
La configuración mínima agrega 1 nodo de expansión de GPU instalado de fábrica. Se pueden instalar más nodos en la fábrica o después del despliegue. El cableado está preinstalado para una configuración de rack completa, independientemente del número de nodos instalados de fábrica. Un único rack de expansión contiene hasta 6 nodos de GPU. Se pueden conectar dos racks de expansión al rack base para un máximo de 12 nodos de GPU.

|
Llamada |
Cantidad |
Descripción |
|---|---|---|
|
A |
6 |
Nodo de GPU configuración mínima: 1, rack máximo: 6 |
|
B |
1 |
relleno del cepillo - permite el enrutamiento del cable desde la parte posterior a los conectores en la parte delantera |
|
C |
1 |
conmutador de gestión |
|
D |
2 |
Unidad de distribución de energía universal (UPDU) |
|
E |
2 |
switch de interconexión de módulos |
|
(ninguno) |
18 |
el panel del relleno instalado en las 12 unidades de rack superiores y en espacios vacíos entre los componentes |