Uso de NVIDIA GPU Cloud con Oracle Cloud Infrastructure
NVIDIA GPU Cloud (NGC) es una plataforma en la nube acelerada por GPU optimizada para el aprendizaje exhaustivo y la informática científica. En este tema se proporciona una visión general de cómo utilizar NGC con Oracle Cloud Infrastructure.
NVIDIA hace que esté disponible en Oracle Cloud Infrastructure una imagen informática personalizada optimizada para las GPU NVIDIA Tesla Volta y Pascal. La ejecución de contenedores NGC en esta instancia proporciona un rendimiento óptimo para tareas de aprendizaje exhaustivo.
Antes de empezar
Prepare lo siguiente:
-
Arrendamiento de Oracle Cloud Infrastructure con una cuota de GPU. Para obtener más información sobre las cuotas, consulte Cuotas de Compute.
-
Una red en la nube en la que iniciar la instancia. Para obtener información sobre la configuración de redes en la nube, consulte Gestión de redes virtuales en la nube y subredes en VCNs y subredes.
-
Un par de claves para conectarse a la instancia mediante shell seguro. Para obtener más información sobre la generación de un par de claves, consulte Gestión de pares de claves en instancias de Linux.
-
Grupo de seguridad y política configurados para el servicio Almacenamiento de archivos. Para obtener más información, consulte Gestión de grupos, Gestión de dominios de identidad y Detalles del servicio de almacenamiento de archivos.
-
Una clave de la API de NGC para autenticarse con el servicio NGC.
Generar su clave de API de NGC-
Conéctese al sitio web de NGC.
-
En la página Registro de NGC, haga clic en Obtener clave de API.
-
Haga clic en Generar clave de API y, a continuación, en Confirmar para generar la clave. Si ya dispone de una clave de API, ésta pasará a no ser válida cuando genere una clave nueva.
-
Inicio de una instancia basada en la imagen de NGC
Uso de la consola
- Abra la consola. Para obtener pasos, consulte Conexión por primera vez.
- Abra el menú de navegación y seleccione Recursos informáticos. En Recursos informáticos, seleccione Instancias.
- Seleccione un compartimento en el que tenga permiso para trabajar.
- Haga clic en Crear instancia.
-
Introduzca un nombre para la instancia. Evite introducir información confidencial.
- En la sección Ubicación, seleccione el dominio de disponibilidad en el que desea crear la instancia.
- En la sección Imagen y unidad:
- En la tarjeta Unidad, haga clic en Cambiar unidad. A continuación, haga lo siguiente:
-
Para Tipo de instancia, seleccione Máquina virtual o Máquina con hardware dedicado.
-
Seleccione una unidad GPU para la instancia. Para obtener más información sobre las unidades GPU, consulte las unidades GPU de máquina virtual y las unidades GPU con hardware dedicado.
Importante
Para acceder a las unidades GPU, el arrendamiento debe tener una cuota de GPU. Si el arrendamiento no tiene una cuota de GPU, las unidades de GPU no se mostrarán en la lista de unidades. Para obtener más información, consulte Antes de empezar. - Haga clic en Seleccionar unidad.
-
-
Para seleccionar la imagen NGC, en la tarjeta Imagen, haga clic en Cambiar imagen. A continuación, haga lo siguiente.Importante
Para acceder a las imágenes de NVIDIA GPU Cloud, el arrendamiento debe tener una cuota de GPU y debe seleccionar una unidad GPU.- En la lista Origen de imagen, seleccione Imágenes de Oracle.
- Seleccione la casilla de control situada junto a la imagen de NVIDIA GPU Cloud Machine.
- Revise y acepte las condiciones de uso y, a continuación, haga clic en Seleccionar imagen.
- En la tarjeta Unidad, haga clic en Cambiar unidad. A continuación, haga lo siguiente:
-
En la sección Red, deje la opción Seleccionar red virtual existente en la nube seleccionada y, a continuación, seleccione el compartimento de red virtual en la nube (VCN), la VCN, el compartimento de subred y la subred.
-
En la sección Agregar claves SSH, cargue la parte de la clave pública del par de claves que desea utilizar para el acceso SSH a la instancia. Busque el archivo de claves que desea cargar, o bien arrastre y suelte el archivo en el cuadro.
-
Haga clic en Crear.
Ahora debería ver la instancia de NGC con el estado Aprovisionando. Una vez que el estado ha cambiado a En ejecución, puede conectarse a la instancia. Para obtener información general sobre el inicio de instancias informáticas, consulte Creación de una instancia.
Consulte los temas siguientes para obtener más información sobre los pasos que se deben realizar para acceder a la instancia y trabajar con ella:
Al conectarse a la instancia con SSH, se le solicitará la clave de la API de NGC. Si proporciona la clave de la API cuando se le indique, la instancia le conectará automáticamente al registro de contenedores de NGC para que pueda ejecutar contenedores del registro. Puede optar por no proporcionar la clave de la API en la petición de datos y aún así podrá conectarse a la instancia. A continuación, puede conectarse más tarde al registro de contenedores de NGC. Consulte Conexión al registro de contenedores de NGC para obtener más información.
Uso de la CLI
Oracle Cloud Infrastructure proporciona una interfaz de línea de comandos (CLI) que puede utilizar para realizar tareas. Para obtener más información, consulte Inicio rápido y Configuración de la CLI.
Use el comando Iniciar para crear una instancia, especificando la imagen de sourceType y el OCID de imagen ocid1.image.oc1..aaaaaaaaknl6phck7e3iuii4r4axpwhenw5qtnnsk3tqppajdjzb5nhoma3q
en InstanceSourceDetails para LaunchInstanceDetails.
Uso del servicio Almacenamiento de archivos para el almacenamiento de datos persistentes
Puede utilizar el servicio Almacenamiento de archivos para el almacenamiento de datos al trabajar con NGC. Para obtener más información, consulte Visión general del almacenamiento de archivos. Consulte las tareas siguientes para crear y trabajar con el servicio Almacenamiento de archivos:
Uso del servicio Volumen en bloque para el almacenamiento de datos persistentes
Puede utilizar el servicio Volumen en bloque para el almacenamiento de datos al trabajar con NGC. Para obtener más información, consulte Visión general de volumen de bloque. Consulte las tareas siguientes para crear y trabajar con el servicio Volumen en bloque:
- Creación de un volumen en bloque
- Asociación de un volumen en bloque a una instancia
- Conexión a un volumen en bloque
También puede usar la interfaz de línea de comandos para gestionar volúmenes en bloque; consulte los comandos de volumen.
Uso del servicio Almacenamiento de objetos para el almacenamiento de datos persistentes
Puede utilizar el servicio Object Storage para el almacenamiento de datos al trabajar con NGC. Para obtener más información, consulte Visión general de almacenamiento de objetos. Consulte las tareas siguientes para crear y trabajar con el servicio Object Storage:
- Creación de un cubo de Object Storage
- Formas de acceder a Object Storage
- Objetos de Object Storage
- Carga de un objeto de almacenamiento de objetos a un cubo
También puede utilizar la CLI para gestionar el almacenamiento de objetos. Consulte el comando os.
Ejemplos de contenedores en ejecución
Primero debe conectarse al registro de contenedores de NGC. Puede omitir esta sección si ha proporcionado la clave de la API al conectarse a la instancia mediante shell seguro. Si al conectarse a la instancia no proporcionó su clave de la API, deberá realizar este paso.
-
Ejecute el siguiente comando de Docker:
docker login nvcr.io
-
Cuando se le solicite un nombre de usuario, introduzca
$oauthtoken
. -
Cuando se le solicite una contraseña, introduzca su clave de la API de NGC.
En este punto, puede ejecutar comandos de Docker y acceder al registro de contenedores de NGC desde la instancia.
En este ejemplo se muestra cómo ejecutar el ejemplo MNIST en PyTorch. En este ejemplo se descarga el juego de datos MNIST desde el web.
-
Recupere y ejecute el contenedor PyTorch con los siguientes comandos de Docker:
docker pull nvcr.io/nvidia/pytorch:17.10 docker run --gpus all --rm -it nvcr.io/nvidia/pytorch:17.10
-
Ejecute el ejemplo MNIST con los comandos siguientes:
cd /opt/pytorch/examples/mnist python main.py
En este ejemplo se muestra cómo ejecutar el ejemplo MNIST en TensorFlow. En este ejemplo se descarga el juego de datos MNIST desde el web.
-
Recupere y ejecute el contenedor TensorFlow con los siguientes comandos de Docker:
docker pull nvcr.io/nvidia/tensorflow:17.10 docker run --gpus all --rm -it nvcr.io/nvidia/tensorflow:17.10
-
Ejecute el ejemplo MNIST_with_summaries con los comandos siguientes:
cd /opt/tensorflow/tensorflow/examples/tutorials/mnist python mnist_with_summaries.py