Configuration du rack d'extension GPU

Private Cloud Appliance avec extension GPU fournit une plate-forme évolutive pour créer des applications exigeantes en IA et en graphiques dans l'environnement de cloud privé.

Il est conçu pour alimenter la nouvelle génération de charges de travail de centre de données, notamment :

  • Inférence en IA générative : inférence en temps réel pour les pipelines d'IA générative multimodèle (texte, image, audio et vidéo)

  • Formation et affinage des LLM : performances accélérées pour affiner les LLM moyens et former les petits LLM avec le moteur de transformateur de NVIDIA et le support FP8

  • Applications graphiques intensives et VDI : 3D graphiques et flux de travail de rendu avec les fonctionnalités RTX et de ray tracing de NVIDIA

  • Jumeaux numériques utilisant NVIDIA Omniverse : développer et exploiter des workflows complexes de numérisation industrielle 3D

  • Media streaming : augmentation de la densité de codage/décodage et prise en charge de AV1 pour le streaming vidéo 4K

  • HPC : analyses de données scientifiques et charges de travail de simulation avec le support FP32

Les extensions de GPU nécessitent la version logicielle de l'appareil 3.0.2-b1325160 (mars 2025) ou une version plus récente. Un rack d'extension de GPU X10-2c contient de 1 à 6 noeuds de serveur de calcul L40S GPU X10-2c. Pour s'intégrer à l'infrastructure de réseau physique du rack de base, deux commutateurs Leaf Cisco Nexus 9336C-FX2 et un commutateur de gestion Cisco Nexus 9348GC-FXP sont installés. Ce rack ne comprend pas de matériel de stockage.

Configuration du rack GPU X10-2c

La configuration minimale ajoute 1 noeud d'extension de GPU installé en usine. D'autres noeuds peuvent être installés en usine ou après le déploiement. Le câblage est préinstallé pour une configuration en rack complet, quel que soit le nombre de noeuds installés en usine. Un seul rack d'extension contient jusqu'à 6 noeuds GPU. Deux racks d'extension peuvent être connectés au rack de base, pour un maximum de 12 noeuds GPU.


Figure illustrant les composants installés dans un rack d'extension de GPU.

Appel

Quantité

Description

A

6

Noeud GPU

configuration minimale : 1, rack maximum : 6

B

1

remplissage de brosse - permet l'acheminement des câbles de l'arrière vers les connecteurs à l'avant

C

1

Commutateur de gestion

D

2

Unité de distribution de puissance universelle (UPDU)

E

2

Commutateur Leaf

(aucun)

18

panneau du remplissage

installés dans les 12 unités de rack supérieures et dans des espaces vides entre les composants