Calcul de haute performance
Le calcul de haute performance exécute des calculs complexes et traite les données plus rapidement que le calcul traditionnel. Le calcul de haute performance utilise des serveurs sans système d'exploitation, un réseau en grappe à très faible latence, des options de stockage haute performance et des systèmes de fichiers parallèles. Cette infrastructure permet le traitement en parallèle pour les charges de travail gourmandes en calcul telles que l'intelligence artificielle, l'apprentissage profond, l'analyse de données, les simulations scientifiques et toute autre charge de travail hautement intensive.
Introduction au calcul de haute performance
Vous pouvez créer une instance de calcul de haute performance à un seul noeud avec le flux de travail de création d'instance standard. Si vous voulez utiliser plusieurs instances de calcul de haute performance dans un groupe de réseau RDMA, vous pouvez les créer au moyen de réseaux en grappe avec des groupes d'instances ou de grappes de calcul.
Utilisation des réseaux en grappe RDMA
Les réseaux en grappe à accès direct à la mémoire distant (RDMA) sont des groupes d'instances de calcul de haute performance, GPU ou optimisées qui sont connectées au moyen d'un réseau large bande à très faible latence. Chaque noeud de la grappe est une machine sans système d'exploitation localisée physiquement à proximité des autres noeuds. Un réseau RDMA (accès direct en mémoire distant) entre les noeuds assure une latence aussi faible qu'en microsecondes à un chiffre, comparable aux grappes de calcul de haute performance sur place.
Les réseaux en grappe sont conçus pour des charges de travail de calcul parallèles très exigeantes. Par exemple :
- Simulations de mécanique des fluides numérique pour la modélisation automobile ou aérospatiale
- Modélisation financière et analyse du risque
- Simulations biologiques
- Analyse et conception de trajectoires pour l'exploration de l'espace
- Charges de travail d'intelligence artificielle et de mégadonnées
Oracle Cloud Infrastructure offre deux types de réseau en grappe. Dans les deux cas, les réseaux sont des groupes d'instances sans système d'exploitation connectées au moyen d'un réseau à très faible latence.
- Les réseaux en grappe avec des groupes d'instances vous permettent d'utiliser des groupes d'instances pour gérer des groupes d'instances identiques dans le groupe de réseaux RDMA. Si vous souhaitez disposer d'une capacité prévisible pour un nombre spécifique d'instances identiques gérées en tant que groupe, utilisez des réseaux en grappe avec des groupes d'instances.
- Les grappes de calcul vous permettent de gérer les instances de la grappe individuellement. Lorsque vous créez une grappe de calcul, vous créez un groupe de réseaux RDMA vide. Une fois le groupe créé, vous pouvez ajouter ou supprimer des instances dans ce groupe. Si vous souhaitez gérer les instances du réseau RDMA indépendamment les unes des autres ou utiliser différents types d'instance dans le groupe de réseaux, utilisez des grappes de calcul.
Plugiciels Oracle Cloud Agent pour le calcul de haute performance
Oracle Cloud Infrastructure offre un plugiciel d'agent en nuage propre aux instances sans système d'exploitation de calcul de haute performance pour simplifier la configuration et l'authentification des réseaux de calcul de haute performance, et fournir une surveillance spécialisée pour le calcul de haute performance.
Le plugiciel de calcul de haute performance est disponible pour le calcul de haute performance dans toutes les régions commerciales.
Forme | Images prises en charge | Paramètre par défaut |
---|---|---|
MODÈLE:BM.GPU.A10.4 | Ubuntu 20.04+, OL7, OL8, CentOS 7+ | Recommandé sur OCA 1.37.0 ou plus |
BM.GPU.A100 | Ubuntu 20.04+, OL7, OL8, CentOS 7+ | Recommandé sur OCA 1.37.0 ou plus |
MODÈLE:BM.GPU.H100.8 | Ubuntu 20.04+, OL7, OL8 | Activé sur OCA 1.37.0 ou supérieur |
BM.GPU4.8 | Ubuntu 20.04+, OL7, OL8, CentOS 7+ | Recommandé sur OCA 1.37.0 ou plus |
BM.HPC2.36 | Ubuntu 20.04+, OL7, OL8, CentOS 7+ | Recommandé sur OCA 1.37.0 ou plus |
BM.Optimized3.36 | Ubuntu 20.04+, OL7, OL8 | Activé sur OCA 1.37.0 ou supérieur |
- Configuration automatique
- Applique les paramètres de carte réseau recommandés sur les formes GPU
- Applique les paramètres Mellanox Connect-X recommandés sur les formes GPU
- Affecte des adresses IP aux interfaces réseau RDMA en fonction du VCN principal
- Authentification/Configuration RDMA
- Configure les interfaces réseau RDMA avec les valeurs recommandées QoS et MTU
- Configure et tient à jour l'authentification réseau RDMA requise
- Surveillance GPU et RDMA
- Émet des mesures de rendement RDMA et GPU supplémentaires
Pour activer le plugiciel de calcul de haute performance sur une instance sans système d'exploitation existante, vous devez créer ou migrer l'instance existante vers Oracle Cloud Agent 1.35.0 ou une version supérieure. Voir Oracle Cloud Agent pour plus d'informations.
Activation des mesures GPU et RDMA
Lorsque vous installez Oracle Cloud Agent et activez le plugiciel de surveillance de calcul de haute performance, les mesures GPU et RDMA sont automatiquement activées. OCI envoie les mesures à l'espace de noms du client et les facture à la location.
Pour déterminer si ces mesures entraîneront des frais supplémentaires, voir Tarifs.
Pour obtenir la liste détaillée des mesures de calcul de haute performance, voir Mesures d'instance de calcul.