Iniciando uma Execução de Job
Use execuções de jobs do serviço Data Science para aplicar vários casos de uso a jobs criados.
A criação de job define a infraestrutura e o artefato real do caso do uso, mas a execução do job executa o job com os parâmetros especificados. As execuções de jobs provisionam a infraestrutura especificada, executam o artefato do job e, em seguida, desprovisionam e destroem os recursos usados quando a execução do job é encerrada.
- Se você estiver iniciando uma execução de job de nó único, siga as etapas em Usando a Console para Iniciar Execuções de Job de Nó Único.
- Se você estiver iniciando uma execução de job de vários nós, siga as etapas em Usando a Console para Iniciar Execuções de Job de Vários Nós.
Usando a Console para Iniciar Execuções de Job de Nó ÚnicoUsando a Console para Iniciar Execuções de Job de Nó Único
- Na página da lista de jobs, selecione o nome do job com o qual trabalhar. Se precisar de ajuda para encontrar a lista de jobs, consulte Listando Jobs.
- Selecione Iniciar uma execução de job.
- (Opcional) Selecione outro compartimento para a execução do job.
- (Opcional) Informe um nome para a execução do job (limite de 255 caracteres). Caso você não forneça um nome, um nome é gerado automaticamente.
Por exemplo,
jobrun20210808222435
. - (Opcional) Substitua a configuração de job padrão que foi definida quando o job foi criado usando estas opções:
Informe ou selecione um dos valores a seguir:
- Chave de variável de ambiente personalizada
-
As variáveis de ambiente que controlam o job.
- Valor
-
O valor da chave de variável de ambiente personalizada.
Você pode selecionar Chave de ambiente personalizada adicional para especificar mais variáveis.
- Argumentos de linha de comando
-
Os argumentos de linha de comando que deseja usar para executar o job.
- Runtime máximo (em minutos)
-
O tempo máximo em minutos que a execução do job pode durar. O serviço cancelará a execução do job se o runtime exceder o valor especificado. O runtime máximo é de 30 dias (43.200 minutos). Recomendamos que você configure um runtime máximo em todas as execuções de jobs para evitar fuga de execuções.
- (Opcional) Informe um valor para a substituição máxima de runtime (em minutos).
-
Substitua a configuração do recurso de rede, que foi definida quando o job foi criado.
O tipo de rede não pode ser alterado.
- Se a Rede Padrão estiver configurada, nada poderá ser substituído.
- Se o serviço Custom Networking estiver configurado, você terá a opção de alterar a VCN e a sub-rede selecionadas.
- (Opcional) Altere a forma de Computação selecionando Alterar forma. Em seguida, siga estas etapas no painel Selecionar computação.
- Selecione um tipo de instância.
- Selecione uma série de formas.
- Selecione uma das formas de Computação suportadas na série.
-
Selecione a forma mais adequada à maneira como deseja usar o recurso.
Para cada OCPU, selecione até 64 GB de memória e um total máximo de 512 GB. A quantidade mínima de memória permitida é 1 GB ou um valor correspondente ao número de OCPUs, o que for maior.
-
Se estiver usando VMs expansíveis, alterne Burstable.
Em Utilização da linha de base por OCPU, selecione a porcentagem de OCPUs que você geralmente deseja usar. Os valores suportados são 12,5% e 50%.
- Selecione Selecionar forma.
- (Opcional) Substituir a configuração de Armazenamento.
Informe o volume de armazenamento em blocos a ser usado entre 50 GB e 10, 240 GB (10 TB). Você pode alterar o valor em incrementos de 1 GB.
-
Substitua a configuração do ambiente, que foi definida quando o job foi criado, usando estas opções:
- Em Configuração de ambiente, selecione Selecionar. O painel Definir seu ambiente BYOC é exibido.
- Em Repositório, selecione um repositório na lista. Se o repositório estiver em outro compartimento, selecione Alterar compartimento.
- Em Imagem, selecione uma imagem na lista.
- (Opcional) Em Ponto de entrada, informe um ponto de entrada. Para adicionar outro, selecione o parâmetro +Add.
- (Opcional) Em CMD, informe um CMD. Para adicionar outro, selecione o parâmetro +Add.Observação
use CMD como argumentos para o ENTRYPOINT ou o único comando a ser executado na ausência de um ENTRYPOINT. - (Opcional) Em Compilação de imagem, informe uma compilação de imagem.
- (Opcional) Em ID da Assinatura, se estiver usando a verificação de assinatura, digite o OCID da assinatura da imagem. Por exemplo,
ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
. - Selecione Selecionar.
- (Opcional) Substitua a configuração de Registro em Log.
- Selecione um grupo de logs na lista. Você pode mudar para outro compartimento para especificar um grupo de logs em outro compartimento do job.
-
Selecione uma das seguintes opções para armazenar todas as mensagens
stdout
estderr
:- Ativar criação automática de log
-
O Data Science cria automaticamente um log quando o job é iniciado.
- Selecionar um log
-
Selecione um log a ser usado.
- (Opcional) Substitua a sondagem de inicialização.
- Insira um comando.
- (Opcional) Para adicionar outro comando, selecione comando +Add e repita a etapa a.
- (Opcional) Informe um valor para o atraso inicial (em segundos).
- (Opcional) Informe um valor do período.
- (Opcional) Informe um valor para o limite de falha.
- Selecione Salvar.
- (Opcional) Selecione Mostrar opções avançadas para adicionar tags à execução do job.
- (Opcional) Na seção Tags, adicione uma ou mais tags à execução do job. Se você tiver permissões para criar uma execução de job, também terá permissões para aplicar tags de formato livre a essa execução de job. Para aplicar uma tag definida, você deve ter permissões para usar o namespace da tag. Para obter mais informações sobre tags, consulte Tags de Recursos. Se você não tiver certeza se deseja aplicar tags, ignore essa opção ou pergunte a um administrador. Você pode aplicar tags posteriormente.
- Selecione Iniciar.
Usando a Console para Iniciar Execuções de Jobs de Vários NósUsando a Console para Iniciar Execuções de Jobs de Vários Nós
- Na página da lista de jobs, selecione o nome do job com o qual trabalhar. Se precisar de ajuda para localizar a lista de jobs, consulte Listando Jobs.
- Selecione Iniciar uma execução de job.
- (Opcional) Selecione outro compartimento para a execução do job.
- (Opcional) Informe um nome para a execução do job (limite de 255 caracteres). Caso você não forneça um nome, um nome é gerado automaticamente.
Por exemplo,
jobrun20210808222435
. - (Opcional) Informe um valor para a substituição máxima de runtime (em minutos).
-
Substitua a configuração do recurso de rede, que foi definida quando o job foi criado.
O tipo de rede não pode ser alterado.
- Se a Rede Padrão estiver configurada, nada poderá ser substituído.
- Se o serviço Custom Networking estiver configurado, você terá a opção de alterar a VCN e a sub-rede selecionadas.
- (Opcional) Substitua a configuração do grupo de nós, que foi definida quando o job foi criado.
As configurações de cada grupo de nós podem ser substituídas individualmente clicando no menu Ações (três pontos) do grupo de nós e selecionando Editar.
- (Opcional) Substitua o número de réplicas.
- (Opcional) Substitua o número mínimo de réplicas que devem ter êxito.
- (Opcional) Substitua o Armazenamento. Informe o volume de armazenamento em blocos a ser usado entre 50 GB e 10, 240 GB (10 TB). Você pode alterar o valor em incrementos de 1 GB.
-
(Opcional) Substitua a configuração de job padrão usando estas opções:
Informe ou selecione qualquer um dos seguintes valores:- Chave de variável de ambiente personalizada
-
As variáveis de meio ambiente que controlam o job.
- Valor
-
O valor da chave da variável de ambiente personalizada.
Você pode selecionar Chave de ambiente personalizada adicional para especificar mais variáveis.
- Argumentos de linha de comando
-
Os argumentos de linha de comando que deseja usar para executar o job.
-
Altere a forma de Computação selecionando Alterar forma. Em seguida, siga estas etapas no painel Selecionar computação.
- Selecione um tipo de instância.
- Selecione uma série de formas.
- Selecione uma das formas de Computação suportadas na série.
-
Selecione a forma mais adequada à maneira como deseja usar o recurso.
Para cada OCPU, selecione até 64 GB de memória e um total máximo de 512 GB. A quantidade mínima de memória permitida é 1 GB ou um valor correspondente ao número de OCPUs, o que for maior.
-
Se estiver usando VMs expansíveis, alterne Burstable.
Em Utilização da linha de base por OCPU, selecione a porcentagem de OCPUs que você geralmente deseja usar. Os valores suportados são 12,5% e 50%.
- Selecione Selecionar forma.
- (Opcional) Substitua a configuração de Sondas:
- Insira um comando.
- (Opcional) Para adicionar outro comando, selecione comando +Add e repita a etapa a.
- (Opcional) Informe um valor para o atraso inicial (em segundos).
- (Opcional) Informe um valor do período.
- (Opcional) Informe um valor para o limite de falha.
- Selecione Salvar.
- (Opcional) Substitua a configuração de Registro em Log.
- Selecione um grupo de logs na lista. Você pode mudar para outro compartimento para especificar um grupo de logs em outro compartimento do job.
-
Selecione uma das seguintes opções para armazenar todas as mensagens
stdout
estderr
:- Ativar criação automática de log
-
O serviço Data Science cria automaticamente um log quando o job é iniciado.
- Selecionar um log
-
Selecione um log a ser usado.
- (Opcional) Selecione Mostrar opções avançadas para adicionar tags à execução do job.
- (Opcional) Na seção Tags, adicione uma ou mais tags à execução do job. Se você tiver permissões para criar uma execução de job, também terá permissões para aplicar tags de formato livre a essa execução de job. Para aplicar uma tag definida, você deve ter permissões para usar o namespace da tag. Para obter mais informações sobre tags, consulte Tags de Recursos. Se você não tiver certeza se deseja aplicar tags, ignore essa opção ou pergunte a um administrador. Você pode aplicar as tags posteriormente.
- Selecione Iniciar.
Essas variáveis de ambiente controlam o job.
Use a CLI do Serviço Data Science para iniciar execuções de job como neste exemplo:
-
Inicie uma execução de job com:
oci data-science job-run create \ --display-name <job_run_name> \ --compartment-id <compartment_ocid> \ --project-id <project_ocid> \ --job-id <job_ocid> \ --configuration-override-details file://<optional_job_run_configuration_override_json_file> \ --log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file>
- (Opcional) Use este arquivo JSON de substituição de configuração da execução de job para substituir as configurações definidas no job principal:
jobEnvironmentConfigurationDetails: { jobEnvironmentType: "OCIR_CONTAINER", image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3", imageDigest: "sha256", cmd: ["ls", "-h"], entrypoint: ["-l"], imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq", }, jobConfigurationDetails: { jobType: "DEFAULT", environmentVariables: <envar-list-object>}, ... }
- (Opcional) Use este arquivo JSON de substituição de configuração do registro em log da execução de job para substituir a configuração de registro em log definida no job principal:
{ "enableLogging": true, "enableAutoLogCreation": true, "logGroupId": "<log_group_ocid>" }
-
Inicie uma execução de job com:
O ADS SDK também é uma biblioteca Python disponível publicamente que você pode instalar com este comando:
pip install oracle-ads
Ele fornece o wrapper que torna o trabalho inicial executado a partir de notebooks ou na sua máquina cliente fácil.