Utilisation de NVIDIA GPU Cloud avec Oracle Cloud Infrastructure
NVIDIA GPU Cloud (NGC) est une plate-forme cloud d'accélération GPU optimisée pour l'apprentissage approfondi et le calcul scientifique. Cette rubrique explique comment utiliser NGC avec Oracle Cloud Infrastructure.
NVIDIA met à disposition sur Oracle Cloud Infrastructure une image Compute personnalisée optimisée pour les GPU NVIDIA Tesla Volta et Pascal. L'exécution de conteneurs NGC sur cette instance fournit des performances optimales pour les travaux d'apprentissage approfondi.
Avant de commencer
Préparez les éléments suivants :
-
Une location Oracle Cloud Infrastructure disposant d'un quota GPU. Pour plus d'informations sur les quotas, reportez-vous à Quotas de Compute.
-
Un réseau cloud dans lequel lancer l'instance. Pour plus d'informations sur la configuration des réseaux cloud, reportez-vous à Gestion des réseaux cloud virtuels et des sous-réseaux dans Réseaux cloud virtuels et sous-réseaux.
-
Une paire de clés à utiliser pour se connecter à l'instance via SSH. Pour plus d'informations sur la génération d'une paire de clés, reportez-vous à Gestion des paires de clés sur les instances Linux.
-
Groupe de sécurité et stratégie configurés pour le service File Storage. Pour plus d'informations, reportez-vous à Gestion des groupes, à Gestion des domaines d'identité et à Détails du service File Storage.
-
Une clé d'API NGC pour l'authentification auprès du service NGC.
Procédure de génération de la clé d'API NGC-
Connectez-vous au site Web NGC.
-
Sur la page NGC Registry, cliquez sur Get API Key.
-
Cliquez sur Generate API Key, puis sur Confirm pour générer la clé. Si vous disposez d'une clé d'API existante, elle ne sera plus valide une fois que vous aurez généré une nouvelle clé.
-
Lancement d'une instance à partir de l'image NGC
Utilisation de la console
- Ouvrez la console. Pour connaître les étapes, reportez-vous à la section Connexion initiale.
- Ouvrez le menu de navigation et sélectionnez Compute. Sous Compute, sélectionnez Instances.
- Sélectionnez un compartiment dans lequel vous êtes autorisé à travailler.
- Cliquez sur Create instance (Créer une instance).
-
Saisissez un nom pour l'instance. Evitez de saisir des informations confidentielles.
- Dans la section Placement, sélectionnez le domaine de disponibilité dans lequel vous souhaitez créer l'instance.
- Dans la section Image et Forme :
- Sur la carte Forme, cliquez sur Modifier une forme. Ensuite, effectuez les opérations suivantes :
-
Pour type d'instance, sélectionnez Machine virtuelle ou Machine bare metal.
-
Sélectionnez une forme GPU pour l'instance. Pour plus d'informations sur les formes GPU, reportez-vous aux formes GPU de machine virtuelle et aux formes GPU Bare Metal.
Important
Pour accéder aux formes GPU, votre location doit disposer d'un quota GPU. Si la location n'a pas de quota GPU, les formes GPU ne figurent pas dans la liste des formes. Pour plus d'informations, reportez-vous à Avant de commencer. - Cliquez sur Sélectionner une forme,
-
-
Pour sélectionner l'image NGC, sur la carte Image, cliquez sur Modifier l'image. Ensuite, procédez comme suit.Important
Pour accéder aux images NVIDIA GPU Cloud, votre location doit disposer d'un quota GPU et vous devez sélectionner une forme GPU.- Dans la liste Source de l'image, sélectionnez Images Oracle.
- Cochez la case en regard de l'option Image de machine NVIDIE GPU Cloud.
- Consultez et acceptez les conditions d'utilisation, puis cliquez sur Sélectionner une image (Select image).
- Sur la carte Forme, cliquez sur Modifier une forme. Ensuite, effectuez les opérations suivantes :
-
Dans la section Fonctions de réseau, laissez l'option Sélectionner un réseau cloud virtuel existant sélectionnée, puis sélectionnez le compartiment du réseau cloud virtuel (VCN), le VCN, le compartiment du sous-réseau et le sous-réseau.
-
Dans la section Ajouter une clé SSH, téléchargez la partie de clé publique de la paire de clés à utiliser pour l'accès SSH à l'instance. Accédez au fichier de clés à télécharger, ou glissez-déplacez le fichier dans la zone.
-
Cliquez sur Créer.
L'instance NGC doit maintenant apparaître avec l'état Provisionnement. Une fois que l'état est devenu En cours d'exécution, vous pouvez vous connecter à l'instance. Pour obtenir des informations générales sur le lancement des instances de calcul, reportez-vous à Création d'une instance.
Reportez-vous aux rubriques suivantes pour obtenir la procédure permettant d'accéder à l'instance et de l'utiliser :
Lorsque vous vous connectez à l'instance à l'aide de SSH, vous êtes invité à indiquer la clé d'API NGC. Si vous indiquez la clé d'API à l'invite, l'instance vous connecte automatiquement au registre du conteneur NGC pour que vous puissiez exécuter des conteneurs à partir du registre. Vous pouvez choisir de ne pas fournir la clé d'API à l'invite et de vous connecter quand même à l'instance. Vous pourrez vous connecter ultérieurement au registre du conteneur NGC. Pour plus d'informations, reportez-vous à Connexion au registre du conteneur NGC.
Utilisation de l'interface de ligne de commande
Oracle Cloud Infrastructure fournit une interface de ligne de commande qui permet d'effectuer des tâches. Pour plus d'informations, reportez-vous à Démarrage rapide et à Configuration de l'interface de ligne de commande.
Utilisez la commande de lancement pour créer une instance, en indiquant l'image pour sourceType et l'OCID d'image ocid1.image.oc1..aaaaaaaaknl6phck7e3iuii4r4axpwhenw5qtnnsk3tqppajdjzb5nhoma3q dans InstanceSourceDetailspour LaunchInstanceDetails.
Utilisation du service File Storage pour le stockage de données persistantes
Vous pouvez avoir recours au service File Storage pour les données lorsque vous travaillez avec NGC. Pour plus d'informations, reportez-vous à Présentation de File Storage. Reportez-vous aux tâches suivantes pour créer et utiliser le service File Storage :
Utilisation du service Block Volume pour le stockage de données persistantes
Vous pouvez utiliser le service Block Volume pour les services de stockage de données lorsque vous travaillez avec NGC. Pour plus d'informations, reportez-vous à Présentation de Block Volume. Reportez-vous aux tâches suivantes pour créer et utiliser le service Block Volume :
- Création d'un volume de blocs
- Attachement d'un volume de bloc à une instance
- Connexion à un volume de blocs
Vous pouvez également utiliser l'interface de ligne de commande pour gérer les volumes de blocs. Reportez-vous aux commandes de volume.
Utilisation du service Object Storage pour le volume de données persistantes
Vous pouvez avoir recours au service Object Storage pour le stockage des données lorsque vous travaillez avec NGC. Pour plus d'informations, reportez-vous à Présentation d'Object Storage. Pour créer le service Object Storage et l'utiliser, reportez-vous aux tâches suivantes :
- Création d'un bucket Object Storage
- Méthodes d'accès à Object Storage
- Objets Object Storage
- Téléchargement d'un objet Object Storage vers un bucket
Vous pouvez également utiliser l'interface de ligne de commande pour gérer le stockage d'objets. Reportez-vous à la commande os.
Exemples de conteneurs en cours d'exécution
Vous devez d'abord vous connecter au registre du conteneur NGC. Vous pouvez ignorer cette section si vous avez indiqué votre clé d'API lors de la connexion à l'instance via SSH. Si vous n'avez pas fourni votre clé d'API lors de la connexion à l'instance, vous devez effectuer cette étape.
-
Exécutez la commande Docker suivante :
docker login nvcr.io -
Lorsque vous êtes invité à saisir un nom utilisateur, entrez
$oauthtoken. -
Lorsque vous êtes invité à entrer un mot de passe, entrez la clé d'API NGC.
A ce stade, vous pouvez exécuter des commandes Docker et accéder au registre du conteneur NGC à partir de l'instance.
Cet exemple illustre l'exécution de l'exemple MNIST sous PyTorch. Dans cet exemple, l'ensemble de données MNIST est téléchargé à partir du Web.
-
Extrayez et exécutez le conteneur PyTorch avec les commandes Docker suivantes :
docker pull nvcr.io/nvidia/pytorch:17.10 docker run --gpus all --rm -it nvcr.io/nvidia/pytorch:17.10 -
Exécutez l'exemple MNIST avec les commandes suivantes :
cd /opt/pytorch/examples/mnist python main.py
Cet exemple illustre l'exécution de l'exemple MNIST sous TensorFlow. Dans cet exemple, l'ensemble de données MNIST est téléchargé à partir du Web.
-
Extrayez et exécutez le conteneur TensorFlow avec les commandes Docker suivantes :
docker pull nvcr.io/nvidia/tensorflow:17.10 docker run --gpus all --rm -it nvcr.io/nvidia/tensorflow:17.10 -
Exécutez l'exemple MNIST_with_summaries avec les commandes suivantes :
cd /opt/tensorflow/tensorflow/examples/tutorials/mnist python mnist_with_summaries.py