Criando um Job
Criar e executar um job no Data Science.
Antes de Começar
- Certifique-se de ter criado as políticas, autenticação e autorização necessárias para seus jobs.
- Crie um arquivo de artefato de job ou crie um contêiner personalizado.
- Para armazenar e gerenciar logs do job, saiba como registrar em log.
- Para usar montagens de armazenamento, você deve ter um bucket do Object Storage ou um ponto de acesso NFS (FSS) do OCI File Storage Service e um caminho de exportação.
- Para montagens de armazenamento, certifique-se de ter a autorização para usar montagens de armazenamento.
-
Para usar o FSS, é necessário primeiro criar o sistema de arquivos e o ponto de montagem. Use a opção de rede personalizada e certifique-se de que o ponto de acesso NFS e o notebook estejam configurados com a mesma sub-rede. Configure regras de lista de segurança para a sub-rede com as portas e protocolos específicos.
Certifique-se de que os limites de serviço sejam alocados para
file-system-countemount-target-count.
Informações básicas
Selecionar um ou vários nós e fornecer informações de identificação.
- Tipo de job: Selecione a opção relevante.
- Nó Único: Uma máquina para o job.
- Multinó: vários nós para um job exigente.
- Compartimento (Opcional): Selecione outro compartimento para o job.
- Nome (Opcional): Informe um nome para o job (limite de 255 caracteres). Se você não fornecer um nome, um nome é gerado automaticamente. Exemplo:
job20210808222435
Configuração
Especifique as informações a seguir.
- Adicionar grupo de nós (somente jobs com vários nós): Selecione para adicionar uma configuração de grupo de nós. Adicione até 5 grupos de nós.
- Nome: Informe um nome exclusivo para o grupo de nós.
- Replicas: Informe o número de réplicas.
- Réplicas de sucesso mínimas: Informe o número mínimo de réplicas que devem ter sucesso.
- Campos asteriscos (*)
- (Opcional) Se você tiver mais de um grupo de nós, especifique a ordem de inicialização do grupo de nós, em paralelo ou em sequência.
- Chave de variável de ambiente personalizada* (Opcional): Variáveis de ambiente que controlam o job.Observação
Se você tiver feito upload de um arquivo zip ou compactado tar, adicione aJOB_RUN_ENTRYPOINTcomo uma variável de ambiente personalizada para apontar para o arquivo. - Valor* (Opcional): Valor da chave de variável de ambiente personalizada.
- Argumentos da linha de comandos* (Opcional): Os argumentos da linha de comandos que você deseja usar para executar o job.
- Máximo de runtime (em minutos) (Opcional): O número máximo de minutos que o job pode executar. O serviço cancelará a execução do job se o runtime exceder o valor especificado. O tempo de execução máximo é de 30 dias (43.200 minutos). Recomendamos que você configure um runtime máximo em todas as execuções de jobs para evitar fuga de execuções.
- Alterar forma* (Opcional): Altere a forma de Computação selecionando Alterar forma. Em seguida, siga estas etapas no painel Selecionar forma de computação.
- Selecione um tipo de instância.
- Selecione uma série de formas.
- Selecione uma das formas de Computação suportadas na série. Selecione a forma que melhor se adapte à forma como deseja usar o recurso.
- Expanda a forma selecionada para configurar OCPUs e memória.
- Número de OCPUs
- Quantidade de memória (GB): Para cada OCPU, selecione até 64 GB de memória e um total máximo de 512 GB. A quantidade mínima de memória permitida é 1 GB ou um valor correspondente ao número de OCPUs, o que for maior.
- Ativar Forma Expansível: Selecione se estiver usando VMs expansíveis e, em seguida, para Utilização da linha de base por OCPU, selecione a porcentagem de OCPUs que você geralmente deseja usar. Os valores suportados são 12,5% e 50%. (Para implantações de modelo, somente o valor de 50% é suportado.)
- Selecione Selecionar forma.
- Armazenamento: Digite o volume de armazenamento em blocos a ser usado entre 50 GB e 10.240 GB (10 TB). Você pode alterar o valor em incrementos de 1 GB.
- Recursos de rede: Selecione a opção relevante.
- Rede Padrão: Restringe o tráfego somente aos serviços Oracle. O sistema usa a rede existente gerenciada pelo serviço. A carga de trabalho é anexada usando uma VNIC secundária a uma VCN e sub-rede pré-configuradas gerenciadas pelo serviço. Essa sub-rede fornecida possibilita a saída para a internet pública por meio de um gateway NAT e o acesso a outros serviços doOracle Cloud por meio de um gateway de serviço.
Se você precisar de acesso apenas à internet pública e aos serviços da OCI, recomendamos o uso dessa opção. Não é necessário criar recursos de rede ou gravar políticas para permissões de rede.
- Rede padrão com internet: Permite acesso de saída à internet por meio do gateway NAT do serviço Data Science.Observação
Você não pode usar Rede padrão com internet em realms desconectados e tenancies de desenvolvimento da Oracle. Se sua tenancy ou compartimento tiver uma política de zona de segurança do serviço Data Science que negue acesso à rede pública (por exemplo,deny model_deploy_public_network— consulte Política de zona de segurança do serviço Data Science), a opção de acesso à internet pública gerenciada pelo serviço será desativada. Se você tentar usar essa opção, receberá um erro404NotAuthorizedOrNotFound. - Rede Personalizada: Selecione a VCN e sub-rede (por compartimento) que você deseja usar.
Para acesso de saída à Internet pública, use uma sub-rede privada com uma rota para um gateway NAT.
Observação
- A rede personalizada deve ser usada para usar uma montagem de armazenamento de arquivos.
- Não há suporte para a alternância de rede personalizada para rede gerenciada após a criação.
- Se você vir o banner
The specified subnet is not accessible. Select a different subnet., crie uma política que permita ao serviço Data Science usar a rede personalizada. Consulte Políticas.
- Rede Padrão: Restringe o tráfego somente aos serviços Oracle. O sistema usa a rede existente gerenciada pelo serviço. A carga de trabalho é anexada usando uma VNIC secundária a uma VCN e sub-rede pré-configuradas gerenciadas pelo serviço. Essa sub-rede fornecida possibilita a saída para a internet pública por meio de um gateway NAT e o acesso a outros serviços doOracle Cloud por meio de um gateway de serviço.
- Fazer upload do artefato de job (Opcional se BYOC estiver configurado): Faça upload do artefato de job arrastando o arquivo de artefato de job necessário para a caixa.
Observação
Um asterisco (*) para um campo indica um posicionamento diferente para jobs com vários nós. Se você estiver criando um job com vários nós, localize o campo adicionando um grupo de nós: Em Configuração, selecione Adicionar grupo de nós. O campo aparece no painel Adicionar grupo de nós.Configuração adicional
Especifique as informações a seguir.
- Ativar log (Opcional): Configure o log.
- Compartimento do grupo de logs: Selecione o compartimento que contém o grupo de logs.
- Grupo de logs: Selecione o grupo.
- Ativar criação automática de log: Selecione essa opção para criar automaticamente um log quando o job for iniciado. O log criado armazena todas as mensagens
stdoutestderr. - Selecionar um log: Selecione esta opção (e selecione um log existente) para armazenar todas as mensagens
stdoutestderr.
- Ativar BYOC / Configuração de ambiente > Selecionar* (Obrigatório para jobs com vários nós): Configure um ambiente para BYOC (Bring Your Own Container).
- Compartimento: Selecione o compartimento que contém o repositório.
- Repositório: selecione um repositório na lista.
- Imagem: Selecione a imagem que você deseja utilizar.
- Ponto de Entrada: Informe um ponto de entrada.
- CMD: Informe um comando.Observação
use CMD como argumentos para o ENTRYPOINT ou o único comando a ser executado na ausência de um ENTRYPOINT. - Compilação de imagens: Informe uma compilação de imagens.
- Id da assinatura: Se estiver usando a verificação de assinatura, informe o OCID da assinatura da imagem. Exemplo:
ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
- Montagens de armazenamento de arquivos (Opcional): Selecione Adicionar montagem de armazenamento de arquivos e insira as seguintes informações.
- Compartimento: Selecione o compartimento que contém o destino que você deseja montar.
- Ponto de acesso NFS: o ponto de acesso NFS que você deseja usar.
- Caminho de exportação: o caminho de exportação que você deseja usar.
- Caminho e diretório de destino: Informe o caminho a ser usado para montar o armazenamento.
O caminho deve começar com um caractere alfanumérico. O diretório de destino deve ser exclusivo nas montagens de armazenamento fornecidas. Os caracteres permitidos são alfanuméricos, hífen ( - ) e sublinhado ( _ ).
Você pode especificar o caminho completo, como
/opc/storage-directory. Se apenas um diretório for especificado, como/storage-directory, ele será montado sob o diretório/mntpadrão. Não é possível especificar diretórios específicos do SO, como/binou/etc.
- Montagens do armazenamento de objetos (Opcional): Selecione Adicionar montagem do armazenamento de objetos e especifique as seguintes informações.
- Compartimento: Selecione o compartimento que contém o bloco que você deseja montar.
- Bloco: Selecione o bloco que você deseja usar.
- Prefixo do nome do objeto (Opcional): Prefixo do nome do objeto. O prefixo deve começar com um caractere alfanumérico. Os caracteres permitidos são alfanuméricos, barra ( / ), hífen ( - ) e sublinhado ( _ ).
- Caminho e diretório de destino: Informe o caminho a ser usado para montar o armazenamento.
O caminho deve começar com um caractere alfanumérico. O diretório de destino deve ser exclusivo nas montagens de armazenamento fornecidas. Os caracteres permitidos são alfanuméricos, hífen ( - ) e sublinhado ( _ ).
Você pode especificar o caminho completo, como o
/opc/storage-directory. Se apenas um diretório for especificado, como/storage-directory, ele será montado no diretório/mntpadrão. Não é possível especificar diretórios específicos do SO, como/binou/etc.
Observação
Se estiver usando uma rede personalizada:- Crie o gateway do serviço na VCN.
- Para as configurações da tabela de roteamento na sub-rede privada, adicione o gateway de serviço.
- Altere as regras de saída da lista de segurança da sub-rede necessária para permitir o tráfego para todos os serviços na rede.
- Sondagem* (Obrigatório para jobs com vários nós): Configure a sondagem de inicialização.
- Selecione Selecionar.
- No painel Sondas, insira as informações a seguir.
- Comando
- Atraso inicial (em segundos)
- Período
- Limite de falha
- Selecione Salvar.
- Tags (em Opções avançadas): Adicione tags ao job. Se você tiver permissões para criar um recurso, também terá permissões para aplicar tags de formato livre a esse recurso. Para aplicar uma tag definida, você deve ter permissões para usar o namespace da tag. Para obter mais informações sobre tags, consulte Tags de Recursos. Se você não tiver certeza se deseja aplicar tags, ignore essa opção ou pergunte a um administrador. Você pode aplicar tags posteriormente.
Observação
Um asterisco (*) para um campo indica um posicionamento diferente para jobs com vários nós. Se você estiver criando um job com vários nós, localize o campo adicionando um grupo de nós: Em Configuração, selecione Adicionar grupo de nós. O campo aparece no painel Adicionar grupo de nós.Verificar e criar
Verifique a configuração e selecione Criar.
Depois que o job estiver em um estado ativo, você poderá usar execuções de job para executar o job repetidamente.
- Tipo de job: Selecione a opção relevante.
Essas variáveis de ambiente controlam o job.
Use a CLI do Serviço Data Science para criar um job, como neste exemplo:
O ADS SDK também é uma biblioteca Python disponível publicamente que você pode instalar com este comando:
pip install oracle-adsEle fornece o wrapper que facilita a criação e a execução de jobs em notebooks ou na sua máquina cliente.