Iniciando uma Execução de Job

Use execuções de jobs do serviço Data Science para aplicar vários casos de uso a jobs criados.

A criação de job define a infraestrutura e o artefato real do caso do uso, mas a execução do job executa o job com os parâmetros especificados. As execuções de jobs provisionam a infraestrutura especificada, executam o artefato do job e, em seguida, desprovisionam e destroem os recursos usados quando a execução do job é encerrada.

    • Se você estiver iniciando uma execução de job de nó único, siga as etapas em Nó Único.
    • Se você estiver iniciando uma execução de job de vários nós, siga as etapas em Vários Nós.

    Nó Único

    Use estas etapas para iniciar uma execução de job de nó único.
    1. Na página de lista Projetos, selecione o projeto que contém os jobs com os quais você deseja trabalhar. Se precisar de ajuda para localizar a página da lista ou o projeto, consulte Listando Projetos.
    2. Na página de detalhes do projeto, selecione Jobs.
    3. Selecione o cargo.
    4. Selecione Execuções de job.
    5. Selecione Iniciar uma execução de job.
    6. Na página Iniciar uma execução de job, especifique as informações a seguir.
      • Compartimento (Opcional): Selecione outro compartimento para a execução do job.
      • Name (Opcional): Informe um nome para a execução do job (limite de 255 caracteres). Se você não fornecer um nome, um nome é gerado automaticamente. Exemplo: jobrun20210808222435
      • Chave de variável de ambiente personalizada* (Opcional): Variáveis de ambiente que controlam o job.
      • Valor* (Opcional): Valor da chave de variável de ambiente personalizada.
      • Argumentos da linha de comandos* (Opcional): Os argumentos da linha de comandos que você deseja usar para executar o job.
      • Máximo de runtime (em minutos) (Opcional): O número máximo de minutos que o job pode executar. O serviço cancelará a execução do job se o runtime exceder o valor especificado. O tempo de execução máximo é de 30 dias (43.200 minutos). Recomendamos que você configure um runtime máximo em todas as execuções de jobs para evitar fuga de execuções.
      • Recursos de rede: Selecione a opção relevante.
        • Rede Padrão: Restringe o tráfego somente aos serviços Oracle. O sistema usa a rede existente gerenciada pelo serviço. A carga de trabalho é anexada usando uma VNIC secundária a uma VCN e sub-rede pré-configuradas gerenciadas pelo serviço. Essa sub-rede fornecida possibilita a saída para a internet pública por meio de um gateway NAT e o acesso a outros serviços doOracle Cloud por meio de um gateway de serviço.

          Se você precisar de acesso apenas à internet pública e aos serviços da OCI, recomendamos o uso dessa opção. Não é necessário criar recursos de rede ou gravar políticas para permissões de rede.

        • Rede padrão com internet: Permite acesso de saída à internet por meio do gateway NAT do serviço Data Science.
          Observação

          Você não pode usar Rede padrão com internet em realms desconectados e tenancies de desenvolvimento da Oracle. Se sua tenancy ou compartimento tiver uma política de zona de segurança do serviço Data Science que negue acesso à rede pública (por exemplo, deny model_deploy_public_network — consulte Política de zona de segurança do serviço Data Science), a opção de acesso à internet pública gerenciada pelo serviço será desativada. Se você tentar usar essa opção, receberá um erro 404 NotAuthorizedOrNotFound.
        • Rede Personalizada: Selecione a VCN e sub-rede (por compartimento) que você deseja usar.

          Para acesso de saída à Internet pública, use uma sub-rede privada com uma rota para um gateway NAT.

          Observação

          • A rede personalizada deve ser usada para usar uma montagem de armazenamento de arquivos.
          • Não há suporte para a alternância de rede personalizada para rede gerenciada após a criação.
          • Se você vir o banner The specified subnet is not accessible. Select a different subnet., crie uma política que permita ao serviço Data Science usar a rede personalizada. Consulte Políticas.
      • Alterar forma* (Opcional): Altere a forma de Computação selecionando Alterar forma. Em seguida, siga estas etapas no painel Selecionar forma de computação.
        • Selecione um tipo de instância.
        • Selecione uma série de formas.
        • Selecione uma das formas de Computação suportadas na série. Selecione a forma que melhor se adapte à forma como deseja usar o recurso.
        • Expanda a forma selecionada para configurar OCPUs e memória.
          • Número de OCPUs
          • Quantidade de memória (GB): Para cada OCPU, selecione até 64 GB de memória e um total máximo de 512 GB. A quantidade mínima de memória permitida é 1 GB ou um valor correspondente ao número de OCPUs, o que for maior.
          • Ativar Forma Expansível: Selecione se estiver usando VMs expansíveis e, em seguida, para Utilização da linha de base por OCPU, selecione a porcentagem de OCPUs que você geralmente deseja usar. Os valores suportados são 12,5% e 50%. (Para implantações de modelo, somente o valor de 50% é suportado.)
        • Selecione Selecionar forma.
      • Substituição de armazenamento* (Opcional): Substitua a configuração de Armazenamento. Informe o volume de armazenamento em blocos a ser usado entre 50 GB e 10, 240 GB (10 TB). Você pode alterar o valor em incrementos de 1 GB.
      • Ativar Substituição BYOC / Substituição de configuração de ambiente > Selecionar* (Opcional): Selecione para substituir a configuração de ambiente definida do job:
        • Compartimento: Selecione o compartimento que contém o repositório.
        • Repositório: selecione um repositório na lista.
        • Imagem: Selecione a imagem que você deseja utilizar.
        • Ponto de Entrada: Informe um ponto de entrada.
        • CMD: Informe um comando.
          Observação

          use CMD como argumentos para o ENTRYPOINT ou o único comando a ser executado na ausência de um ENTRYPOINT.
        • Compilação de imagem: Informe uma compilação de imagem.
        • Id da assinatura: Se estiver usando a verificação de assinatura, informe o OCID da assinatura da imagem. Exemplo: ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
      • Ativar log (Opcional): Substitua a configuração de log.
        • Compartimento do grupo de logs: Selecione o compartimento que contém o grupo de logs.
        • Grupo de logs: Selecione o grupo.
        • Ativar criação automática de log: Selecione essa opção para criar automaticamente um log quando o job for iniciado. O log criado armazena todas as mensagens stdout e stderr.
        • Selecionar um log: Selecione esta opção (e selecione um log existente) para armazenar todas as mensagens stdout e stderr.
      • Substituição de sondagens* (Opcional): Substitua a sondagem de inicialização.
        1. Selecione Selecionar.
        2. No painel Sondas, insira as informações a seguir.
          • Comando
          • Atraso inicial (em segundos)
          • Período
          • Limite de falha
        3. Selecione Salvar.
      • Tags (em Opções avançadas): Adicione tags à execução do job. Se você tiver permissões para criar um recurso, também terá permissões para aplicar tags de formato livre a esse recurso. Para aplicar uma tag definida, você deve ter permissões para usar o namespace da tag. Para obter mais informações sobre tags, consulte Tags de Recursos. Se você não tiver certeza se deseja aplicar tags, ignore essa opção ou pergunte a um administrador. Você pode aplicar as tags posteriormente.
      Observação

      Um asterisco (*) para um campo indica um posicionamento diferente para jobs com vários nós. Se você estiver iniciando uma execução de job para um job com vários nós, localize o campo editando o grupo de nós: Em Substituição de configuração do grupo de nós, no menu Ações (três pontos) do grupo de nós, selecione Editar. O campo é exibido no painel resultante.
    7. Selecione Iniciar.

    Vários Nós

    Use estas etapas para iniciar uma execução de job de vários nós.
    1. Na página de lista Projetos, selecione o projeto que contém os jobs com os quais você deseja trabalhar. Se precisar de ajuda para localizar a página da lista ou o projeto, consulte Listando Projetos.
    2. Na página de detalhes do projeto, selecione Jobs.
    3. Selecione o cargo.
    4. Selecione Execuções de job.
    5. Selecione Iniciar uma execução de job.
    6. Na página Iniciar uma execução de job, especifique as informações descritas em Nó Único.

      Os campos são idênticos às execuções de job de nó único com as diferenças a seguir.

      • Campos asteriscos (*) aparecem no painel para editar um grupo de nós.
      • Os campos a seguir só estão disponíveis para jobs com vários nós, no painel para editar um grupo de nós.
        • Replicas (número de réplicas)
        • Réplicas de sucesso mínimas (número de réplicas que devem ter sucesso)

        Para abrir o painel de edição de um grupo de nós: Em Substituição de configuração do grupo de nós, no menu Ações (três pontos) do grupo de nós, selecione Editar.

    7. Selecione Iniciar.
  • Essas variáveis de ambiente controlam o job.

    Use a CLI do Serviço Data Science para iniciar execuções de job como neste exemplo:

    1. Inicie uma execução de job com:
      oci data-science job-run create \
      --display-name <job_run_name> \
      --compartment-id <compartment_ocid> \
      --project-id <project_ocid> \
      --job-id <job_ocid> \
      --configuration-override-details file://<optional_job_run_configuration_override_json_file> \
      --log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file>
                                      
    2. (Opcional) Use este arquivo JSON de substituição de configuração da execução de job para substituir as configurações definidas no job principal:
      jobEnvironmentConfigurationDetails: {
        jobEnvironmentType: "OCIR_CONTAINER",
          image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3",
          imageDigest: "sha256",
        cmd: ["ls", "-h"],
        entrypoint: ["-l"],
          imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq",
      },
          jobConfigurationDetails: {
              jobType: "DEFAULT",
              environmentVariables: <envar-list-object>},
          ...
      }
    3. (Opcional) Use este arquivo JSON de substituição de configuração do registro em log da execução de job para substituir a configuração de registro em log definida no job principal:
      {
        "enableLogging": true,
        "enableAutoLogCreation": true,
        "logGroupId": "<log_group_ocid>"
      }
  • O ADS SDK também é uma biblioteca Python disponível publicamente que você pode instalar com este comando:

    pip install oracle-ads

    Ele fornece o wrapper que torna o trabalho inicial executado a partir de notebooks ou na sua máquina cliente fácil.

    Use o ADS SDK para iniciar execuções de jobs.