Inicio de una ejecución de trabajo

Utilice ejecuciones de trabajos de Data Science para aplicar varios casos de uso a trabajos creados.

La creación de los trabajos define la infraestructura y el artefacto del caso del uso real, pero la ejecución de trabajos ejecuta el trabajo con los parámetros especificados. Las ejecuciones de trabajos aprovisionan la infraestructura especificada, ejecutan el artefacto de trabajo y a continuación, anulan el aprovisionamiento y destruyen el recurso utilizado cuando finaliza el trabajo.

- Si está iniciando una ejecución de trabajo de nodo único, siga los pasos de Nodo único.
- Si está iniciando una ejecución de trabajo de varios nodos, siga los pasos de Multi Node.
Nodo único
Utilice estos pasos para iniciar una ejecución de trabajo de nodo único.
En la página de lista Proyectos, seleccione el proyecto que contiene los trabajos con los que desea trabajar. Si necesita ayuda para buscar la página de lista o el proyecto, consulte Lista de proyectos.
En la página de detalles del proyecto, seleccione Trabajos.
Seleccione el puesto.
Seleccione Ejecuciones de trabajo.
Seleccione Start a job run.
En la página Iniciar una ejecución de trabajo, introduzca la siguiente información.

Compartimento (opcional): seleccione un compartimento diferente para la ejecución del trabajo.

Nombre (Opcional): introduzca un nombre para la ejecución del trabajo (límite de 255 caracteres). Si no se proporciona un nombre, se genera automáticamente un nombre. Ejemplo: jobrun20210808222435

Clave de variable de entorno personalizada* (opcional): variables de entorno que controlan el trabajo.

Valor* (opcional): valor de la clave de variable de entorno personalizada.

Argumentos de la línea de comando* (opcional): los argumentos de la línea de comando que desea utilizar para ejecutar el trabajo.

Máximo de tiempo de ejecución (en minutos) (opcional): número máximo de minutos que puede ejecutarse el trabajo. El servicio cancela la ejecución del trabajo si su tiempo de ejecución supera el valor especificado. El tiempo de ejecución máximo es de 30 días (43.200 minutos). Se recomienda configurar un tiempo de ejecución máximo en todas las ejecuciones de trabajos para evitar ejecuciones de trabajos sin control.

Recursos de red: seleccione la opción correspondiente.

Red por defecto: restringe el tráfico solo a los servicios de Oracle. El sistema utiliza la red gestionada por servicios existente. La carga de trabajo se asocia mediante una VNIC secundaria a una VCN y una subred preconfiguradas y gestionadas por servicios. Esta subred proporcionada permite el acceso a la Internet pública a través de un gateway de NAT y al acceso a otros servicios de la nube de Oracle Cloud a través de un gateway de servicio.
Si solo necesita acceso a los servicios públicos de Internet y OCI, le recomendamos que utilice esta opción. No es necesario que cree recursos de red ni escriba políticas para permisos de red.

Redes por defecto con Internet: permite el acceso a Internet saliente a través del gateway de NAT de Data Science.
Nota

No puede utilizar la red por defecto con Internet en dominios desconectados y arrendamientos de desarrollo de Oracle. Si su arrendamiento o compartimento tiene una política de zona de seguridad de Data Science que deniega el acceso a la red pública (por ejemplo, deny model_deploy_public_network, consulte Política de zona de seguridad de Data Science), la opción de acceso a Internet público gestionado por el servicio está desactivada. Si intenta utilizar esta opción, recibirá un error 404 NotAuthorizedOrNotFound.

Red personalizada: seleccione la VCN y subred (por compartimento) que desea utilizar.
Para obtener acceso de salida a la red pública de Internet, utilice una subred privada con una ruta a un gateway de NAT.
Nota

Las redes personalizadas se deben utilizar para utilizar un montaje de almacenamiento de archivos.

Tras la creación, no se admite el cambio de redes personalizadas a redes gestionadas.

Si ve el banner The specified subnet is not accessible. Select a different subnet., cree una política que permita a Data Science utilizar redes personalizadas. Consulte Políticas.

Cambiar unidad* (opcional): cambie la unidad de computación seleccionando Cambiar unidad. A continuación, siga estos pasos en el panel Seleccionar unidad de computación.

Seleccione un tipo de instancia.

Seleccione una serie de formas.

Seleccione una de las unidades de Compute soportadas en la serie. Seleccione la unidad que más se adapte a cómo desea utilizar el recurso.

Amplíe la unidad seleccionada para configurar las OCPU y la memoria.

Número de OCPU

Cantidad de memoria (GB): para cada OCPU, seleccione hasta 64 GB de memoria y un máximo total de 512 GB. La cantidad mínima de memoria permitida es de 1 GB o un valor que coincida con el número de OCPU, cualquiera que sea mayor.

Activar unidad ampliable: seleccione si utiliza máquinas virtuales ampliables y, a continuación, para Utilización de base por OCPU, seleccione el porcentaje de OCPU que normalmente desea utilizar. Los valores soportados son 12,5% y 50%. (Para despliegues de modelos, solo se admite el valor del 50 %).

Seleccione Seleccionar unidad.

Sustitución de almacenamiento* (opcional): sustituya la configuración de almacenamiento. Introduzca la cantidad de almacenamiento de bloques que se utilizará entre 50 GB y 10, 240 GB (10 TB). Puede cambiar el valor en incrementos de 1 GB.

Activar sustitución de BYOC / Sustitución de configuración de entorno > Seleccionar* (opcional): seleccione esta opción para sustituir la configuración de entorno definida del trabajo:

Compartimento: seleccione el compartimento que contiene el repositorio.

Repositorio: seleccione un repositorio de la lista.

Imagen: seleccione la imagen que desea usar.

Punto de entrada: introduzca un punto de entrada.

CMD: introduzca un comando.
Nota

Utilice CMD como argumentos para ENTRYPOINT o como único comando que ejecutar en ausencia de ENTRYPOINT.

Resumen de imagen: introduzca un resumen de imagen.

ID de firma: si se utiliza la verificación de firma, introduzca el OCID de la firma de imagen. Ejemplo: ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...

Activar registro (opcional): sustituya la configuración de registro.

Compartimento de grupo de logs: seleccione el compartimento que contiene el grupo de logs.

Grupo de logs: seleccione el grupo de logs.

Activar Creación Automática de Logs: Seleccione esta opción para crear automáticamente un log cuando se inicie el trabajo. El log creado almacena todos los mensajes stdout y stderr.

Seleccionar un log: seleccione esta opción (y seleccione un log existente) para almacenar todos los mensajes stdout y stderr.

Sustitución de protocolos* (opcional): sustituya el sondeo de inicio.

Seleccione Seleccionar.

En el panel Probes, introduzca la siguiente información.

Comando

Retraso inicial (en segundos)

Período

Umbral de fallo

Seleccione Guardar.

Etiquetas (en Opciones avanzadas): agregue etiquetas a la ejecución del trabajo. Si tiene permisos para crear un recurso, también tiene permisos para aplicar etiquetas de formato libre a dicho recurso. Para aplicar una etiqueta definida, debe tener permisos para utilizar el espacio de nombres de etiqueta. Para obtener más información sobre el etiquetado, consulte Etiquetas de recursos. Si no está seguro de si desea aplicar etiquetas, omita esta opción o pregunte a un administrador. Puede aplicar etiquetas más tarde.

Nota

Un asterisco (*) para un campo indica una ubicación diferente para trabajos de varios nodos. Si está iniciando una ejecución de trabajo para un trabajo de varios nodos, busque el campo editando el grupo de nodos: en Sustitución de configuración de grupo de nodos, en el menú Acciones (tres puntos) del grupo de nodos, seleccione Editar. El campo aparece en el panel resultante.

Seleccione Iniciar.
Varios Nodos
Utilice estos pasos para iniciar una ejecución de trabajo de varios nodos.
En la página de lista Proyectos, seleccione el proyecto que contiene los trabajos con los que desea trabajar. Si necesita ayuda para buscar la página de lista o el proyecto, consulte Lista de proyectos.
En la página de detalles del proyecto, seleccione Trabajos.
Seleccione el puesto.
Seleccione Ejecuciones de trabajo.
Seleccione Iniciar una ejecución de trabajo.
En la página Iniciar una ejecución de trabajo, introduzca la información descrita en Nodo único.

Los campos son idénticos a las ejecuciones de trabajos de un solo nodo con las siguientes diferencias.

Los campos asteriscados (*) aparecen en el panel para editar un grupo de nodos.

Los siguientes campos solo están disponibles para trabajos de varios nodos en el panel para editar un grupo de nodos.

Replicas (número de réplicas)

Réplicas mínimas correctas (número de réplicas que se deben realizar correctamente)

Para abrir el panel para editar un grupo de nodos: en Sustitución de configuración de grupo de nodos, en el menú Acciones (tres puntos) del grupo de nodos, seleccione Editar.

Seleccione Start (Iniciar).

Estas variables de entorno controlan el trabajo.

Utilice la CLI de Data Science para iniciar ejecuciones de trabajos como en este ejemplo:

Inicie una ejecución de trabajo con:

oci data-science job-run create \
--display-name <job_run_name> \
--compartment-id <compartment_ocid> \
--project-id <project_ocid> \
--job-id <job_ocid> \
--configuration-override-details file://<optional_job_run_configuration_override_json_file> \
--log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file>

(Opcional) Utilice este archivo JSON de sustitución de configuración de ejecución de trabajo para sustituir las configuraciones definidas en el trabajo principal:

jobEnvironmentConfigurationDetails: {
  jobEnvironmentType: "OCIR_CONTAINER",
    image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3",
    imageDigest: "sha256",
  cmd: ["ls", "-h"],
  entrypoint: ["-l"],
    imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq",
},
    jobConfigurationDetails: {
        jobType: "DEFAULT",
        environmentVariables: <envar-list-object>},
    ...
}

(Opcional) Utilice este archivo JSON de sustitución de configuración de registro de ejecución de trabajo para sustituir la configuración de registro definida en el trabajo principal:
```
{
  "enableLogging": true,
  "enableAutoLogCreation": true,
  "logGroupId": "<log_group_ocid>"
}
```

El SDK de ADS también es una biblioteca de Python disponible públicamente que puede instalar con este comando:
```
pip install oracle-ads
```
Proporciona el envoltorio que facilita la ejecución de trabajos de inicio desde blocs de notas o en la máquina cliente.

Utilice el SDK de ADS para iniciar ejecuciones de trabajos.

Documentación de Oracle Cloud Infrastructure

Inicio de una ejecución de trabajo

Nodo único

Varios Nodos