Utilisation de NVIDIA GPU Cloud avec Oracle Cloud Infrastructure

NVIDIA GPU Cloud (NGC) est une plate-forme en nuage accélérée par GPU pour l'apprentissage en profondeur et le calcul scientifique. Cette rubrique présente un aperçu de l'utilisation de NGC avec Oracle Cloud Infrastructure.

NVIDIA met à disposition dans Oracle Cloud Infrastructure une image personnalisée du service Calcul optimisée pour les processeurs graphiques NVIDIA Tesla Volta et Pascal. L'exécution de conteneurs NGC sur cette instance fournit une performance optimale pour les travaux d'apprentissage en profondeur.

Avant de commencer

Préparez les éléments suivants :

Lancement d'une instance basée sur l'image NGC

Utilisation de la console

  1. Ouvrez la console. Pour les étapes, voir Première connexion.
  2. Ouvrez le menu de navigation et sélectionnez Calcul. Sous Calcul, sélectionnez Instances.
  3. Sélectionnez un compartiment que vous êtes autorisé à utiliser.
  4. Cliquez sur Créer une instance.
  5. Entrez le nom de l'instance. Évitez d'entrer des informations confidentielles.

  6. Dans la section Positionnement, sélectionnez le domaine de disponibilité dans lequel vous souhaitez créer l'instance.
  7. Dans la section Image et forme :
    1. Sur la carte forme, cliquez sur Modifier la forme. Ensuite, procédez de la façon suivante :
      1. Pour le type d'instance , sélectionnez machine virtuelle ou machine sans système d'exploitation.

      2. Sélectionnez une forme GPU pour l'instance. Pour plus d'informations sur les formes GPU, voir les formes GPU de machine virtuelle et les formes GPU sans système d'exploitation.

        Important

        Pour accéder aux formes GPU, votre location doit avoir un quota GPU. Si votre location n'a pas de quota GPU, les formes GPU ne sont pas incluses dans la liste des formes. Pour plus d'informations, voir Avant de commencer.
      3. Cliquez sur Sélectionner une forme.
    2. Pour sélectionner l'image NGC, sur la carte Image, cliquez sur Modifier l'image. Ensuite, procédez de la façon suivante.
      Important

      Pour accéder aux images NVIDIA GPU Cloud, votre location doit avoir un quota GPU et vous devez sélectionner une forme GPU.
      1. Dans la liste des sources d'image, sélectionnez images Oracle.
      2. Cochez la case à côté de Image de machine NVIDIA GPU Cloud.
      3. Vérifiez et acceptez les conditions d'utilisation, puis cliquez sur Sélectionner une image.
  8. Dans la section Réseau, laissez l'option Sélectionner un réseau en nuage virtuel existant, puis sélectionnez le compartiment du réseau en nuage virtuel (VCN), le VCN, le compartiment du sous-réseau et le sous-réseau.

  9. Dans la section Ajouter des clés SSH, chargez la partie clé publique de la paire de clés que vous voulez utiliser pour l'accès SSH à l'instance. Recherchez le fichier de clés à charger ou déposez-le dans la zone.

  10. Cliquez sur Créer.

Vous devriez maintenant voir l'instance NGC avec l'état Provisionnement. Une fois que l'état passe à En cours d'exécution, vous pouvez vous connecter à l'instance. Pour des informations générales sur le lancement des instances de calcul, voir Création d'une instance.

Voir les rubriques suivantes pour les étapes d'accès et d'utilisation de l'instance :

Lorsque vous vous connectez à l'instance à l'aide de SSH, vous êtes invité à entrer la clé d'API NGC. Si vous fournissez la clé d'API à l'invite, l'instance vous connecte automatiquement au registre de conteneurs NGC afin que vous puissiez exécuter des conteneurs. Vous pouvez choisir de ne pas fournir la clé d'API à l'invite et de vous connecter quand même à l'instance. Vous pouvez ensuite vous connecter au registre de conteneurs NGC. Pour plus d'informations, voir Se connecter au registre de conteneurs NGC.

Utilisation de l'interface de ligne de commande

Oracle Cloud Infrastructure fournit une interface de ligne de commande que vous pouvez utiliser pour effectuer des tâches. Pour plus d'informations, voir Démarrage rapide et Configuration de l'interface de ligne de commande.

Utilisez la commande launch pour créer une instance, en indiquant une image pour sourceType et l'OCID de l'image ocid1.image.oc1..aaaaaaaaknl6phck7e3iuii4r4axpwhenw5qtnnsk3tqppajdjzb5nhoma3q dans InstanceSourceDetails pour LaunchInstanceDetails.

Utilisation du service de volumes par blocs pour le stockage de données persistant

Vous pouvez utiliser le service Volume par blocs pour le stockage de données lors de l'utilisation de NGC. Pour plus d'informations, voir Aperçu du service de volumes par blocs. Voir les tâches suivantes pour créer et utiliser le service Volume par blocs :

Vous pouvez également utiliser l'interface de ligne de commande pour gérer des volumes par blocs; voir les commandes volume.

Utilisation du service de stockage d'objets pour le stockage de données permanent

Vous pouvez utiliser le service de stockage d'objets pour le stockage de données lors de l'utilisation de NGC. Pour plus d'informations, voir Aperçu du stockage d'objets. Voir les tâches suivantes pour créer et utiliser le service de stockage d'objets :

Vous pouvez également utiliser l'interface de ligne de commande pour gérer le stockage d'objets, voir la commande os.

Exemples de conteneurs en cours d'exécution

Vous devez d'abord vous connecter au registre de conteneurs NGC. Vous pouvez ignorer cette section si vous avez fourni une clé d'API lors de la connexion à l'instance au moyen de SSH. Si vous n'avez pas fourni de clé d'API lors de la connexion à l'instance, vous devez effectuer cette étape.

Pour vous connecter au registre de conteneurs NGC
  1. Exécutez la commande Docker suivante :

    docker login nvcr.io
  2. À l'invite d'un nom d'utilisateur, entrez $oauthtoken.

  3. À l'invite d'un mot de passe, entrez votre clé d'API NGC.

À ce stade, vous pouvez exécuter des commandes Docker et accéder au registre de conteneurs NGC à partir de l'instance.

Exemple : Exécution de formation MNIST à l'aide du conteneur PyTorch

Cet exemple illustre l'exécution de l'exemple MNIST sous PyTorch. Cet exemple télécharge le jeu de données MNIST à partir du Web.

  1. Extrayez et exécutez le conteneur PyTorch avec les commandes Docker suivantes :

    docker pull nvcr.io/nvidia/pytorch:17.10
    docker run --gpus all --rm -it nvcr.io/nvidia/pytorch:17.10
  2. Exécutez l'exemple MNIST avec les commandes suivantes :

    cd /opt/pytorch/examples/mnist
    python main.py
Exemple : Exécution de formation MNIST à l'aide du conteneur TensorFlow

Cet exemple illustre l'exécution de l'exemple MNIST sous TensorFlow. Cet exemple télécharge le jeu de données MNIST à partir du Web.

  1. Extrayez et exécutez le conteneur TensorFlow avec les commandes Docker suivantes :

    docker pull nvcr.io/nvidia/tensorflow:17.10
    docker run --gpus all --rm -it nvcr.io/nvidia/tensorflow:17.10
  2. Exécutez l'exemple MNIST_with_summaries avec les commandes suivantes :

    cd /opt/tensorflow/tensorflow/examples/tutorials/mnist
    python mnist_with_summaries.py