Uso de NVIDIA GPU Cloud con Oracle Cloud Infrastructure

NVIDIA GPU Cloud (NGC) es una plataforma en la nube acelerada por GPU optimizada para el aprendizaje exhaustivo y la informática científica. En este tema se proporciona una visión general de cómo utilizar NGC con Oracle Cloud Infrastructure.

NVIDIA hace que esté disponible en Oracle Cloud Infrastructure una imagen informática personalizada optimizada para las GPU NVIDIA Tesla Volta y Pascal. La ejecución de contenedores NGC en esta instancia proporciona un rendimiento óptimo para tareas de aprendizaje exhaustivo.

Antes de empezar

Prepare lo siguiente:

Inicio de una instancia basada en la imagen de NGC

Uso de la consola

  1. Abra la consola. Para obtener pasos, consulte Conexión por primera vez.
  2. Abra el menú de navegación y seleccione Recursos informáticos. En Recursos informáticos, seleccione Instancias.
  3. Seleccione un compartimento en el que tenga permiso para trabajar.
  4. Haga clic en Crear instancia.
  5. Introduzca un nombre para la instancia. Evite introducir información confidencial.

  6. En la sección Ubicación, seleccione el dominio de disponibilidad en el que desea crear la instancia.
  7. En la sección Imagen y unidad:
    1. En la tarjeta Unidad, haga clic en Cambiar unidad. A continuación, haga lo siguiente:
      1. Para Tipo de instancia, seleccione Máquina virtual o Máquina con hardware dedicado.

      2. Seleccione una unidad GPU para la instancia. Para obtener más información sobre las unidades GPU, consulte las unidades GPU de máquina virtual y las unidades GPU con hardware dedicado.

        Importante

        Para acceder a las unidades GPU, el arrendamiento debe tener una cuota de GPU. Si el arrendamiento no tiene una cuota de GPU, las unidades de GPU no se mostrarán en la lista de unidades. Para obtener más información, consulte Antes de empezar.
      3. Haga clic en Seleccionar unidad.
    2. Para seleccionar la imagen NGC, en la tarjeta Imagen, haga clic en Cambiar imagen. A continuación, haga lo siguiente.
      Importante

      Para acceder a las imágenes de NVIDIA GPU Cloud, el arrendamiento debe tener una cuota de GPU y debe seleccionar una unidad GPU.
      1. En la lista Origen de imagen, seleccione Imágenes de Oracle.
      2. Seleccione la casilla de control situada junto a la imagen de NVIDIA GPU Cloud Machine.
      3. Revise y acepte las condiciones de uso y, a continuación, haga clic en Seleccionar imagen.
  8. En la sección Red, deje la opción Seleccionar red virtual existente en la nube seleccionada y, a continuación, seleccione el compartimento de red virtual en la nube (VCN), la VCN, el compartimento de subred y la subred.

  9. En la sección Agregar claves SSH, cargue la parte de la clave pública del par de claves que desea utilizar para el acceso SSH a la instancia. Busque el archivo de claves que desea cargar, o bien arrastre y suelte el archivo en el cuadro.

  10. Haga clic en Crear.

Ahora debería ver la instancia de NGC con el estado Aprovisionando. Una vez que el estado ha cambiado a En ejecución, puede conectarse a la instancia. Para obtener información general sobre el inicio de instancias informáticas, consulte Creación de una instancia.

Consulte los temas siguientes para obtener más información sobre los pasos que se deben realizar para acceder a la instancia y trabajar con ella:

Al conectarse a la instancia con SSH, se le solicitará la clave de la API de NGC. Si proporciona la clave de la API cuando se le indique, la instancia le conectará automáticamente al registro de contenedores de NGC para que pueda ejecutar contenedores del registro. Puede optar por no proporcionar la clave de la API en la petición de datos y aún así podrá conectarse a la instancia. A continuación, puede conectarse más tarde al registro de contenedores de NGC. Consulte Conexión al registro de contenedores de NGC para obtener más información.

Uso de la CLI

Oracle Cloud Infrastructure proporciona una interfaz de línea de comandos (CLI) que puede utilizar para realizar tareas. Para obtener más información, consulte Inicio rápido y Configuración de la CLI.

Use el comando Iniciar para crear una instancia, especificando la imagen de sourceType y el OCID de imagen ocid1.image.oc1..aaaaaaaaknl6phck7e3iuii4r4axpwhenw5qtnnsk3tqppajdjzb5nhoma3q en InstanceSourceDetails para LaunchInstanceDetails.

Uso del servicio Volumen en bloque para el almacenamiento de datos persistentes

Puede utilizar el servicio Volumen en bloque para el almacenamiento de datos al trabajar con NGC. Para obtener más información, consulte Visión general de volumen de bloque. Consulte las tareas siguientes para crear y trabajar con el servicio Volumen en bloque:

También puede usar la interfaz de línea de comandos para gestionar volúmenes en bloque; consulte los comandos de volumen.

Uso del servicio Almacenamiento de objetos para el almacenamiento de datos persistentes

Puede utilizar el servicio Object Storage para el almacenamiento de datos al trabajar con NGC. Para obtener más información, consulte Visión general de almacenamiento de objetos. Consulte las tareas siguientes para crear y trabajar con el servicio Object Storage:

También puede utilizar la CLI para gestionar el almacenamiento de objetos. Consulte el comando os.

Ejemplos de contenedores en ejecución

Primero debe conectarse al registro de contenedores de NGC. Puede omitir esta sección si ha proporcionado la clave de la API al conectarse a la instancia mediante shell seguro. Si al conectarse a la instancia no proporcionó su clave de la API, deberá realizar este paso.

Conectarse al registro de contenedores de NGC
  1. Ejecute el siguiente comando de Docker:

    docker login nvcr.io
  2. Cuando se le solicite un nombre de usuario, introduzca $oauthtoken.

  3. Cuando se le solicite una contraseña, introduzca su clave de la API de NGC.

En este punto, puede ejecutar comandos de Docker y acceder al registro de contenedores de NGC desde la instancia.

Ejemplo: ejecución de formación MNIST mediante el contenedor PyTorch

En este ejemplo se muestra cómo ejecutar el ejemplo MNIST en PyTorch. En este ejemplo se descarga el juego de datos MNIST desde el web.

  1. Recupere y ejecute el contenedor PyTorch con los siguientes comandos de Docker:

    docker pull nvcr.io/nvidia/pytorch:17.10
    docker run --gpus all --rm -it nvcr.io/nvidia/pytorch:17.10
  2. Ejecute el ejemplo MNIST con los comandos siguientes:

    cd /opt/pytorch/examples/mnist
    python main.py
Ejemplo: ejecución de formación MNIST con contenedor TensorFlow

En este ejemplo se muestra cómo ejecutar el ejemplo MNIST en TensorFlow. En este ejemplo se descarga el juego de datos MNIST desde el web.

  1. Recupere y ejecute el contenedor TensorFlow con los siguientes comandos de Docker:

    docker pull nvcr.io/nvidia/tensorflow:17.10
    docker run --gpus all --rm -it nvcr.io/nvidia/tensorflow:17.10
  2. Ejecute el ejemplo MNIST_with_summaries con los comandos siguientes:

    cd /opt/tensorflow/tensorflow/examples/tutorials/mnist
    python mnist_with_summaries.py