Iniciando uma Execução de Job
Use execuções de jobs do serviço Data Science para aplicar vários casos de uso a jobs criados.
A criação de job define a infraestrutura e o artefato real do caso do uso, mas a execução do job executa o job com os parâmetros especificados. As execuções de jobs provisionam a infraestrutura especificada, executam o artefato do job e, em seguida, desprovisionam e destroem os recursos usados quando a execução do job é encerrada.
- Se você estiver iniciando uma execução de job de nó único, siga as etapas em Nó Único.
- Se você estiver iniciando uma execução de job de vários nós, siga as etapas em Vários Nós.
Nó Único
Use estas etapas para iniciar uma execução de job de nó único. - Na página de lista Projetos, selecione o projeto que contém os jobs com os quais você deseja trabalhar. Se precisar de ajuda para localizar a página da lista ou o projeto, consulte Listando Projetos.
- Na página de detalhes do projeto, selecione Jobs.
- Selecione o cargo.
- Selecione Execuções de job.
- Selecione Iniciar uma execução de job.
-
Na página Iniciar uma execução de job, especifique as informações a seguir.
- Compartimento (Opcional): Selecione outro compartimento para a execução do job.
- Name (Opcional): Informe um nome para a execução do job (limite de 255 caracteres). Se você não fornecer um nome, um nome é gerado automaticamente. Exemplo:
jobrun20210808222435 - Chave de variável de ambiente personalizada* (Opcional): Variáveis de ambiente que controlam o job.
- Valor* (Opcional): Valor da chave de variável de ambiente personalizada.
- Argumentos da linha de comandos* (Opcional): Os argumentos da linha de comandos que você deseja usar para executar o job.
- Máximo de runtime (em minutos) (Opcional): O número máximo de minutos que o job pode executar. O serviço cancelará a execução do job se o runtime exceder o valor especificado. O tempo de execução máximo é de 30 dias (43.200 minutos). Recomendamos que você configure um runtime máximo em todas as execuções de jobs para evitar fuga de execuções.
- Recursos de rede: Selecione a opção relevante.
- Rede Padrão: Restringe o tráfego somente aos serviços Oracle. O sistema usa a rede existente gerenciada pelo serviço. A carga de trabalho é anexada usando uma VNIC secundária a uma VCN e sub-rede pré-configuradas gerenciadas pelo serviço. Essa sub-rede fornecida possibilita a saída para a internet pública por meio de um gateway NAT e o acesso a outros serviços doOracle Cloud por meio de um gateway de serviço.
Se você precisar de acesso apenas à internet pública e aos serviços da OCI, recomendamos o uso dessa opção. Não é necessário criar recursos de rede ou gravar políticas para permissões de rede.
- Rede padrão com internet: Permite acesso de saída à internet por meio do gateway NAT do serviço Data Science.Observação
Você não pode usar Rede padrão com internet em realms desconectados e tenancies de desenvolvimento da Oracle. Se sua tenancy ou compartimento tiver uma política de zona de segurança do serviço Data Science que negue acesso à rede pública (por exemplo,deny model_deploy_public_network— consulte Política de zona de segurança do serviço Data Science), a opção de acesso à internet pública gerenciada pelo serviço será desativada. Se você tentar usar essa opção, receberá um erro404NotAuthorizedOrNotFound. - Rede Personalizada: Selecione a VCN e sub-rede (por compartimento) que você deseja usar.
Para acesso de saída à Internet pública, use uma sub-rede privada com uma rota para um gateway NAT.
Observação
- A rede personalizada deve ser usada para usar uma montagem de armazenamento de arquivos.
- Não há suporte para a alternância de rede personalizada para rede gerenciada após a criação.
- Se você vir o banner
The specified subnet is not accessible. Select a different subnet., crie uma política que permita ao serviço Data Science usar a rede personalizada. Consulte Políticas.
- Rede Padrão: Restringe o tráfego somente aos serviços Oracle. O sistema usa a rede existente gerenciada pelo serviço. A carga de trabalho é anexada usando uma VNIC secundária a uma VCN e sub-rede pré-configuradas gerenciadas pelo serviço. Essa sub-rede fornecida possibilita a saída para a internet pública por meio de um gateway NAT e o acesso a outros serviços doOracle Cloud por meio de um gateway de serviço.
- Alterar forma* (Opcional): Altere a forma de Computação selecionando Alterar forma. Em seguida, siga estas etapas no painel Selecionar forma de computação.
- Selecione um tipo de instância.
- Selecione uma série de formas.
- Selecione uma das formas de Computação suportadas na série. Selecione a forma que melhor se adapte à forma como deseja usar o recurso.
- Expanda a forma selecionada para configurar OCPUs e memória.
- Número de OCPUs
- Quantidade de memória (GB): Para cada OCPU, selecione até 64 GB de memória e um total máximo de 512 GB. A quantidade mínima de memória permitida é 1 GB ou um valor correspondente ao número de OCPUs, o que for maior.
- Ativar Forma Expansível: Selecione se estiver usando VMs expansíveis e, em seguida, para Utilização da linha de base por OCPU, selecione a porcentagem de OCPUs que você geralmente deseja usar. Os valores suportados são 12,5% e 50%. (Para implantações de modelo, somente o valor de 50% é suportado.)
- Selecione Selecionar forma.
- Substituição de armazenamento* (Opcional): Substitua a configuração de Armazenamento. Informe o volume de armazenamento em blocos a ser usado entre 50 GB e 10, 240 GB (10 TB). Você pode alterar o valor em incrementos de 1 GB.
- Ativar Substituição BYOC / Substituição de configuração de ambiente > Selecionar* (Opcional): Selecione para substituir a configuração de ambiente definida do job:
- Compartimento: Selecione o compartimento que contém o repositório.
- Repositório: selecione um repositório na lista.
- Imagem: Selecione a imagem que você deseja utilizar.
- Ponto de Entrada: Informe um ponto de entrada.
- CMD: Informe um comando.Observação
use CMD como argumentos para o ENTRYPOINT ou o único comando a ser executado na ausência de um ENTRYPOINT. - Compilação de imagem: Informe uma compilação de imagem.
- Id da assinatura: Se estiver usando a verificação de assinatura, informe o OCID da assinatura da imagem. Exemplo:
ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
- Ativar log (Opcional): Substitua a configuração de log.
- Compartimento do grupo de logs: Selecione o compartimento que contém o grupo de logs.
- Grupo de logs: Selecione o grupo.
- Ativar criação automática de log: Selecione essa opção para criar automaticamente um log quando o job for iniciado. O log criado armazena todas as mensagens
stdoutestderr. - Selecionar um log: Selecione esta opção (e selecione um log existente) para armazenar todas as mensagens
stdoutestderr.
- Substituição de sondagens* (Opcional): Substitua a sondagem de inicialização.
- Selecione Selecionar.
- No painel Sondas, insira as informações a seguir.
- Comando
- Atraso inicial (em segundos)
- Período
- Limite de falha
- Selecione Salvar.
- Tags (em Opções avançadas): Adicione tags à execução do job. Se você tiver permissões para criar um recurso, também terá permissões para aplicar tags de formato livre a esse recurso. Para aplicar uma tag definida, você deve ter permissões para usar o namespace da tag. Para obter mais informações sobre tags, consulte Tags de Recursos. Se você não tiver certeza se deseja aplicar tags, ignore essa opção ou pergunte a um administrador. Você pode aplicar as tags posteriormente.
Observação
Um asterisco (*) para um campo indica um posicionamento diferente para jobs com vários nós. Se você estiver iniciando uma execução de job para um job com vários nós, localize o campo editando o grupo de nós: Em Substituição de configuração do grupo de nós, no menu Ações (três pontos) do grupo de nós, selecione Editar. O campo é exibido no painel resultante. - Selecione Iniciar.
Vários Nós
Use estas etapas para iniciar uma execução de job de vários nós. - Na página de lista Projetos, selecione o projeto que contém os jobs com os quais você deseja trabalhar. Se precisar de ajuda para localizar a página da lista ou o projeto, consulte Listando Projetos.
- Na página de detalhes do projeto, selecione Jobs.
- Selecione o cargo.
- Selecione Execuções de job.
- Selecione Iniciar uma execução de job.
-
Na página Iniciar uma execução de job, especifique as informações descritas em Nó Único.
Os campos são idênticos às execuções de job de nó único com as diferenças a seguir.
- Campos asteriscos (*) aparecem no painel para editar um grupo de nós.
- Os campos a seguir só estão disponíveis para jobs com vários nós, no painel para editar um grupo de nós.
- Replicas (número de réplicas)
- Réplicas de sucesso mínimas (número de réplicas que devem ter sucesso)
Para abrir o painel de edição de um grupo de nós: Em Substituição de configuração do grupo de nós, no menu Ações (três pontos) do grupo de nós, selecione Editar.
- Selecione Iniciar.
Essas variáveis de ambiente controlam o job.
Use a CLI do Serviço Data Science para iniciar execuções de job como neste exemplo:
-
Inicie uma execução de job com:
oci data-science job-run create \ --display-name <job_run_name> \ --compartment-id <compartment_ocid> \ --project-id <project_ocid> \ --job-id <job_ocid> \ --configuration-override-details file://<optional_job_run_configuration_override_json_file> \ --log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file> - (Opcional) Use este arquivo JSON de substituição de configuração da execução de job para substituir as configurações definidas no job principal:
jobEnvironmentConfigurationDetails: { jobEnvironmentType: "OCIR_CONTAINER", image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3", imageDigest: "sha256", cmd: ["ls", "-h"], entrypoint: ["-l"], imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq", }, jobConfigurationDetails: { jobType: "DEFAULT", environmentVariables: <envar-list-object>}, ... } - (Opcional) Use este arquivo JSON de substituição de configuração do registro em log da execução de job para substituir a configuração de registro em log definida no job principal:
{ "enableLogging": true, "enableAutoLogCreation": true, "logGroupId": "<log_group_ocid>" }
-
Inicie uma execução de job com:
O ADS SDK também é uma biblioteca Python disponível publicamente que você pode instalar com este comando:
pip install oracle-adsEle fornece o wrapper que torna o trabalho inicial executado a partir de notebooks ou na sua máquina cliente fácil.