Criando um Job

Criar e executar um job no Data Science.

Antes de Começar

    1. Na página de lista Projetos, selecione o projeto que contém os jobs com os quais você deseja trabalhar. Se precisar de ajuda para localizar a página da lista ou o projeto, consulte Listando Projetos.
    2. Na página de detalhes do projeto, selecione Jobs.
    3. Selecione Criar job.
      A página Criar job é aberta.

    Informações básicas

    Selecionar um ou vários nós e fornecer informações de identificação.

    • Tipo de job: Selecione a opção relevante.
      • Nó Único: Uma máquina para o job.
      • Multinó: vários nós para um job exigente.
    • Compartimento (Opcional): Selecione outro compartimento para o job.
    • Nome (Opcional): Informe um nome para o job (limite de 255 caracteres). Se você não fornecer um nome, um nome é gerado automaticamente. Exemplo: job20210808222435

    Configuração

    Especifique as informações a seguir.

    • Adicionar grupo de nós (somente jobs com vários nós): Selecione para adicionar uma configuração de grupo de nós. Adicione até 5 grupos de nós.
      • Nome: Informe um nome exclusivo para o grupo de nós.
      • Replicas: Informe o número de réplicas.
      • Réplicas de sucesso mínimas: Informe o número mínimo de réplicas que devem ter sucesso.
      • Campos asteriscos (*)
      • (Opcional) Se você tiver mais de um grupo de nós, especifique a ordem de inicialização do grupo de nós, em paralelo ou em sequência.
    • Chave de variável de ambiente personalizada* (Opcional): Variáveis de ambiente que controlam o job.
      Observação

      Se você tiver feito upload de um arquivo zip ou compactado tar, adicione a JOB_RUN_ENTRYPOINT como uma variável de ambiente personalizada para apontar para o arquivo.
    • Valor* (Opcional): Valor da chave de variável de ambiente personalizada.
    • Argumentos da linha de comandos* (Opcional): Os argumentos da linha de comandos que você deseja usar para executar o job.
    • Máximo de runtime (em minutos) (Opcional): O número máximo de minutos que o job pode executar. O serviço cancelará a execução do job se o runtime exceder o valor especificado. O tempo de execução máximo é de 30 dias (43.200 minutos). Recomendamos que você configure um runtime máximo em todas as execuções de jobs para evitar fuga de execuções.
    • Alterar forma* (Opcional): Altere a forma de Computação selecionando Alterar forma. Em seguida, siga estas etapas no painel Selecionar forma de computação.
      • Selecione um tipo de instância.
      • Selecione uma série de formas.
      • Selecione uma das formas de Computação suportadas na série. Selecione a forma que melhor se adapte à forma como deseja usar o recurso.
      • Expanda a forma selecionada para configurar OCPUs e memória.
        • Número de OCPUs
        • Quantidade de memória (GB): Para cada OCPU, selecione até 64 GB de memória e um total máximo de 512 GB. A quantidade mínima de memória permitida é 1 GB ou um valor correspondente ao número de OCPUs, o que for maior.
        • Ativar Forma Expansível: Selecione se estiver usando VMs expansíveis e, em seguida, para Utilização da linha de base por OCPU, selecione a porcentagem de OCPUs que você geralmente deseja usar. Os valores suportados são 12,5% e 50%. (Para implantações de modelo, somente o valor de 50% é suportado.)
      • Selecione Selecionar forma.
    • Armazenamento: Digite o volume de armazenamento em blocos a ser usado entre 50 GB e 10.240 GB (10 TB). Você pode alterar o valor em incrementos de 1 GB.
    • Recursos de rede: Selecione a opção relevante.
      • Rede Padrão: Restringe o tráfego somente aos serviços Oracle. O sistema usa a rede existente gerenciada pelo serviço. A carga de trabalho é anexada usando uma VNIC secundária a uma VCN e sub-rede pré-configuradas gerenciadas pelo serviço. Essa sub-rede fornecida possibilita a saída para a internet pública por meio de um gateway NAT e o acesso a outros serviços doOracle Cloud por meio de um gateway de serviço.

        Se você precisar de acesso apenas à internet pública e aos serviços da OCI, recomendamos o uso dessa opção. Não é necessário criar recursos de rede ou gravar políticas para permissões de rede.

      • Rede padrão com internet: Permite acesso de saída à internet por meio do gateway NAT do serviço Data Science.
        Observação

        Você não pode usar Rede padrão com internet em realms desconectados e tenancies de desenvolvimento da Oracle. Se sua tenancy ou compartimento tiver uma política de zona de segurança do serviço Data Science que negue acesso à rede pública (por exemplo, deny model_deploy_public_network — consulte Política de zona de segurança do serviço Data Science), a opção de acesso à internet pública gerenciada pelo serviço será desativada. Se você tentar usar essa opção, receberá um erro 404 NotAuthorizedOrNotFound.
      • Rede Personalizada: Selecione a VCN e sub-rede (por compartimento) que você deseja usar.

        Para acesso de saída à Internet pública, use uma sub-rede privada com uma rota para um gateway NAT.

        Observação

        • A rede personalizada deve ser usada para usar uma montagem de armazenamento de arquivos.
        • Não há suporte para a alternância de rede personalizada para rede gerenciada após a criação.
        • Se você vir o banner The specified subnet is not accessible. Select a different subnet., crie uma política que permita ao serviço Data Science usar a rede personalizada. Consulte Políticas.
    • Fazer upload do artefato de job (Opcional se BYOC estiver configurado): Faça upload do artefato de job arrastando o arquivo de artefato de job necessário para a caixa.
    Observação

    Um asterisco (*) para um campo indica um posicionamento diferente para jobs com vários nós. Se você estiver criando um job com vários nós, localize o campo adicionando um grupo de nós: Em Configuração, selecione Adicionar grupo de nós. O campo aparece no painel Adicionar grupo de nós.

    Configuração adicional

    Especifique as informações a seguir.

    • Ativar log (Opcional): Configure o log.
      • Compartimento do grupo de logs: Selecione o compartimento que contém o grupo de logs.
      • Grupo de logs: Selecione o grupo.
      • Ativar criação automática de log: Selecione essa opção para criar automaticamente um log quando o job for iniciado. O log criado armazena todas as mensagens stdout e stderr.
      • Selecionar um log: Selecione esta opção (e selecione um log existente) para armazenar todas as mensagens stdout e stderr.
    • Ativar BYOC / Configuração de ambiente > Selecionar* (Obrigatório para jobs com vários nós): Configure um ambiente para BYOC (Bring Your Own Container).
      • Compartimento: Selecione o compartimento que contém o repositório.
      • Repositório: selecione um repositório na lista.
      • Imagem: Selecione a imagem que você deseja utilizar.
      • Ponto de Entrada: Informe um ponto de entrada.
      • CMD: Informe um comando.
        Observação

        use CMD como argumentos para o ENTRYPOINT ou o único comando a ser executado na ausência de um ENTRYPOINT.
      • Compilação de imagens: Informe uma compilação de imagens.
      • Id da assinatura: Se estiver usando a verificação de assinatura, informe o OCID da assinatura da imagem. Exemplo: ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
    • Montagens de armazenamento de arquivos (Opcional): Selecione Adicionar montagem de armazenamento de arquivos e insira as seguintes informações.
      • Compartimento: Selecione o compartimento que contém o destino que você deseja montar.
      • Ponto de acesso NFS: o ponto de acesso NFS que você deseja usar.
      • Caminho de exportação: o caminho de exportação que você deseja usar.
      • Caminho e diretório de destino: Informe o caminho a ser usado para montar o armazenamento.

        O caminho deve começar com um caractere alfanumérico. O diretório de destino deve ser exclusivo nas montagens de armazenamento fornecidas. Os caracteres permitidos são alfanuméricos, hífen ( - ) e sublinhado ( _ ).

        Você pode especificar o caminho completo, como /opc/storage-directory. Se apenas um diretório for especificado, como /storage-directory, ele será montado sob o diretório /mnt padrão. Não é possível especificar diretórios específicos do SO, como /bin ou /etc.

    • Montagens do armazenamento de objetos (Opcional): Selecione Adicionar montagem do armazenamento de objetos e especifique as seguintes informações.
      • Compartimento: Selecione o compartimento que contém o bloco que você deseja montar.
      • Bloco: Selecione o bloco que você deseja usar.
      • Prefixo do nome do objeto (Opcional): Prefixo do nome do objeto. O prefixo deve começar com um caractere alfanumérico. Os caracteres permitidos são alfanuméricos, barra ( / ), hífen ( - ) e sublinhado ( _ ).
      • Caminho e diretório de destino: Informe o caminho a ser usado para montar o armazenamento.

        O caminho deve começar com um caractere alfanumérico. O diretório de destino deve ser exclusivo nas montagens de armazenamento fornecidas. Os caracteres permitidos são alfanuméricos, hífen ( - ) e sublinhado ( _ ).

        Você pode especificar o caminho completo, como o /opc/storage-directory. Se apenas um diretório for especificado, como /storage-directory, ele será montado no diretório /mnt padrão. Não é possível especificar diretórios específicos do SO, como /bin ou /etc.

      Observação

      Se estiver usando uma rede personalizada:
      1. Crie o gateway do serviço na VCN.
      2. Para as configurações da tabela de roteamento na sub-rede privada, adicione o gateway de serviço.
      3. Altere as regras de saída da lista de segurança da sub-rede necessária para permitir o tráfego para todos os serviços na rede.
    • Sondagem* (Obrigatório para jobs com vários nós): Configure a sondagem de inicialização.
      1. Selecione Selecionar.
      2. No painel Sondas, insira as informações a seguir.
        • Comando
        • Atraso inicial (em segundos)
        • Período
        • Limite de falha
      3. Selecione Salvar.
    • Tags (em Opções avançadas): Adicione tags ao job. Se você tiver permissões para criar um recurso, também terá permissões para aplicar tags de formato livre a esse recurso. Para aplicar uma tag definida, você deve ter permissões para usar o namespace da tag. Para obter mais informações sobre tags, consulte Tags de Recursos. Se você não tiver certeza se deseja aplicar tags, ignore essa opção ou pergunte a um administrador. Você pode aplicar tags posteriormente.
    Observação

    Um asterisco (*) para um campo indica um posicionamento diferente para jobs com vários nós. Se você estiver criando um job com vários nós, localize o campo adicionando um grupo de nós: Em Configuração, selecione Adicionar grupo de nós. O campo aparece no painel Adicionar grupo de nós.

    Verificar e criar

    Verifique a configuração e selecione Criar.

    Depois que o job estiver em um estado ativo, você poderá usar execuções de job para executar o job repetidamente.

  • Essas variáveis de ambiente controlam o job.

    Use a CLI do Serviço Data Science para criar um job, como neste exemplo:

    1. Crie um job com:
      oci data-science job create \
      --display-name <job_name>\
      --compartment-id <compartment_ocid>\
      --project-id <project_ocid> \
      --configuration-details file://<jobs_configuration_json_file> \
      --infrastructure-configuration-details file://<jobs_infrastructure_configuration_json_file> \
      --log-configuration-details file://<optional_jobs_infrastructure_configuration_json_file>
                                      
    2. Use este arquivo JSON de configuração de jobs:
      {
        "jobType": "DEFAULT",
        "maximumRuntimeInMinutes": 240,
        "commandLineArguments" : "test-arg",
        "environmentVariables": {
          "SOME_ENV_KEY": "some_env_value" 
        }
      }
    3. Use este arquivo JSON de configuração da infraestrutura de jobs:
      {
        "jobInfrastructureType": "STANDALONE",
        "shapeName": "VM.Standard2.1",
        "blockStorageSizeInGBs": "50",
        "subnetId": "<subnet_ocid>"
      }
    4. (Opcional) Use este arquivo JSON de configuração de registro em log de jobs:
      {
        "enableLogging": true,
        "enableAutoLogCreation": true,
        "logGroupId": "<log_group_ocid>"
      }
    5. Faça upload de um arquivo de artefato de job para o job que você criou com:
      oci data-science job create-job-artifact \
      --job-id <job_ocid> \
      --job-artifact-file <job_artifact_file_path> \
      --content-disposition "attachment; filename=<job_artifact_file_name>"
  • O ADS SDK também é uma biblioteca Python disponível publicamente que você pode instalar com este comando:

    pip install oracle-ads

    Ele fornece o wrapper que facilita a criação e a execução de jobs em notebooks ou na sua máquina cliente.

    Use o ADS SDK para criar e executar jobs.