Outras Maneiras de Executar Jobs

Você pode usar jobs de várias maneiras, como usar ambientes conda e arquivos zip.

Usando Arquivos zip ou tar compactados

Você pode usar jobs para executar um projeto Python inteiro que você compacta em um único arquivo.

arquivos tar compactados ou zip que são executados como um job podem utilizar os ambientes conda de serviço do serviço Data Science e os ambientes conda personalizado.

Para a execução do job, você aponta para o arquivo de entrada principal usando a variável de ambiente JOB_RUN_ENTRYPOINT. Essa variável só é usada com jobs que usam artefatos de job zip ou tar compactados.

Usando um Ambiente Conda do Serviço Data Science

Você pode usar um dos ambientes conda do serviço Data Science que estão incluídos no serviço.

Um ambiente conda encapsula todas as dependências Python de terceiros (como Numpy, Dask ou XGBoost) exigidas pela execução de job. Os ambientes conda do serviço Data Science são incluídos e mantidos no serviço. Se você não especificar um ambiente conda como parte das configurações de job e execução de job, um ambiente conda não será usado porque não há padrão.

O código de job está incorporado em um ambiente conda do serviço Data Science:

Mostra como o código de job está incorporado em um conda, em uma forma e em uma execução de job do serviço Data Science. E o slug do conda no cartão do conda.

Encontre o conda do Data Science que deseja usar e selecione em:
- Na Console:
  1. Em um projeto, crie uma sessão de notebook.
  2. Abra a sessão de notebook.
  3. Exiba os ambientes conda e selecione o conda do Data Science que você deseja usar.
  4. Copie o slug do ambiente conda do cartão selecionado.
    
    Ao executar um job com o conda do serviço Data Science, você não precisa publicá-lo no Object Storage. Você só precisa do valor do slug do conda.
    
    Dica
    
    Você pode testar o código em um notebook antes de executá-lo como job.
- Na lista conda do serviço Data Science de ambientes:
  1. Localize o conda que deseja usar.
  2. Na tabela, copie o slug.

Crie um job e adicione esta variável do ambiente personalizado para especificar o conda da Data Science:

CONDA_ENV_TYPE => "service"
CONDA_ENV_SLUG = <service_conda_environment_slug>

Iniciar uma execução de job e, para usar outro ambiente conda para a execução do job, use as variáveis do ambiente personalizado para substituir a configuração do job.

Usando um Ambiente Conda Personalizado

Você pode usar jobs de um arquivo zip e tar compactados com ambientes conda personalizados ou ambientes conda do serviço Data Science.

Um ambiente conda encapsula todas as dependências Python de terceiros (como Numpy, Dask ou XGBoost) exigidas pela execução de job. Você cria, publica e mantém ambientes conda personalizados. Se você não especificar um ambiente conda como parte das configurações de job e execução de job, um ambiente conda não será usado porque não há padrão

O código de job está incorporado em um ambiente conda personalizado como este:

Mostra como o código de job está incorporado em um conda personalizado, uma forma e uma execução de job. E o slug do conda no cartão do conda.

Crie um ambiente conda personalizado.
Publique-o no Object Storage.
Configure políticas que permitam que o recurso de execução do job acesse os ambientes conda publicados que são armazenados no bucket do Object Storage da sua tenancy.
Criar um job e definir estas variáveis de ambiente (a região é opcional se ela estiver na mesma região que a execução do job):
```
CONDA_ENV_TYPE => "published"
CONDA_ENV_OBJECT_NAME => <full_path_object_storage_name>
CONDA_ENV_REGION => <object_storage_region>
CONDA_ENV_NAMESPACE => <object_storage_namespace>
CONDA_ENV_BUCKET => <object_storage_bucket_name>
                            
```
Importante

O job e a execução do job devem ser configurados com uma sub-rede que tenha um gateway de serviço para acessar o ambiente conda publicado no bucket de Armazenamento de Objetos da tenancy.
Inicie uma execução de job.

(Opcional) Para usar um ambiente conda diferente para execuções de job individuais, defina variáveis de ambiente personalizadas para substituir a configuração de job.
(Opcional) Se você usou o registro em log, poderá revisá-lo para ver os valores de execução de job.

Usando um Arquivo YAML de Runtime

Você pode usar um arquivo YAML de runtime para configurar variáveis de ambiente de job em vez de usar a Console ou o SDK.

Antes de começar:

Faça download, descompacte e revise os arquivos de amostra jobruntime.yaml e conda_pack_test.py para criar e testar seu projeto de job.

O uso de um arquivo jobruntime.yaml facilita a definição de variáveis de ambiente personalizadas no projeto.

Altere o arquivo de amostra jobruntime.yaml para especificar os valores.
Adicione variáveis que deseja usar durante a execução de job. Você pode adicionar variáveis de ambiente específicas de execução do job, como CONDA_ENV_TYPE ou CONDA_ENV_SLUG, e pares de chaves personalizadas.

Por exemplo:
```
CONDA_ENV_TYPE: service
CONDA_ENV_SLUG: dataexpl_p37_cpu_v2
JOB_RUN_ENTRYPOINT: conda_pack_test.py
KEY1: value1
KEY2: 123123
```
Importante

Não há suporte para variáveis aninhadas.

Observe como o JOB_RUN_ENTRYPOINT do projeto é incluído no YAML do runtime , de modo que você não precisará fazer isso manualmente quando executar o job.
Crie um projeto simples com um único arquivo python e o arquivo jobruntime.yaml no diretório raiz de um projeto.

No arquivo python, leia as variáveis de ambiente e imprima-as para testar se estão acessíveis.

Por exemplo:

print("Executing job artifact")
print(os.getenv("CONDA_PREFIX"))
print(os.getenv("CONDA_ENV_SLUG"))
print(os.getenv("JOB_RUN_ENTRYPOINT"))
print(os.getenv("KEY1"))
print(os.getenv("KEY2"))
print(os.getenv("spec"))

Arquive o diretório raiz do projeto em um arquivo zip ou tar compactado.
Por exemplo, para compactar um arquivo em um Mac, você pode usar:
```
zip -r zip-runtime-yaml-artifact.zip zip-runtime-yaml-artifact/ -x ".*" -x "__MACOSX"
```
Na Console, crie um novo job e faça upload do arquivo compactado do job.
Execute o job para ver se ele funciona.

Observe que você não precisa fornecer nenhuma variável de ambiente na execução do job porque elas estão definidas no arquivo .yaml.
Monitore a execução do job para obter uma conclusão bem-sucedida.
(Opcional) Se você usou o registro em log, poderá revisá-lo para ver os valores de execução de job.

Usando um Vault

Você pode integrar o serviço Vault do OCI aos jobs do serviço Data Science usando controladores de recursos.