Copiando um Ambiente Conda para Outra Região

Neste tutorial, você instala um ambiente conda em uma sessão de notebook. Em seguida, você executa as etapas necessárias para instalar o mesmo ambiente conda em uma segunda sessão de notebook hospedada em outra região.

As principais tarefas incluem:

  • Crie dois buckets em duas regiões diferentes em sua tenancy.
  • Registre cada bucket em uma sessão de notebook na respectiva região.
  • Instale um ambiente conda na primeira sessão de notebook.
  • Publique o ambiente conda. (Torne o ambiente conda pronto para ser instalado em qualquer sessão de notebook que tenha acesso ao ambiente.)
  • Na primeira sessão de notebook, adicione o ambiente conda publicado a um bucket da mesma região.
  • Copie o ambiente conda publicado de um bucket para outro.
  • Em uma sessão de notebook na segunda região, instale o ambiente conda usando o segundo bucket.

Para obter mais informações, consulte:

Antes de Começar

Para executar este tutorial com sucesso, você deve ter o seguinte:

Requisitos
  • Uma conta do Oracle Cloud Infrastructure (OCI) paga ou uma nova conta com promoções do Oracle Cloud. Consulte Solicitar e Gerenciar Promoções do Oracle Cloud Grátis

  • Um computador com MacOS, Linux ou Windows.
  • Tutorial do serviço Data Science:
    • Acesse todas as etapas na Configuração Manual de uma Tenancy do Data Science e crie duas sessões de notebook com as seguintes propriedades:
      • Dê ao compartimento do seu trabalho o nome data-science-work.
      • Crie sessões de notebook em duas regiões:
        • Para alterar sua região, na barra de navegação superior da Console, selecione sua região e clique no nome de uma nova região. Por exemplo, mude de US West (Phoenix) para US East (Ashburn).
        • Dê nomes aos seus projetos e às suas sessões de notebook:
          • Em <region-1>: Initial Project e my-first-notebook-session
          • Em <region-2>: Second Project e my-second-notebook-session

1. Criar Buckets

Crie dois buckets para armazenar ambientes conda de my-first-notebook-session e my-second-notebook-session.

Criar Dois Buckets

Crie um bucket em <region-1> e outro em <region-2>.

  1. Abra o menu de navegação e selecione Armazenamento. Em Object Storage e Archive Storage, clique em Buckets.
  2. Na navegação à esquerda, em Escopo da Lista, selecione o compartimento data-science-work.
  3. Na barra de navegação superior, selecione <region-1>. Por exemplo, US West (Phoenix).
  4. Selecione Create Bucket.
  5. Preencha as seguintes informações:
    • Nome: bucket-1
    • Deixe o valor padrão para outros campos:
      • Camada de Armazenamento Padrão: Padrão
      • Encryption: Digite usando chaves gerenciadas pela Oracle
  6. Selecione Criar.
  7. Na lista de buckets, verifique se bucket-1 tem uma Visibilidade Privada:
    Os buckets são privados, a menos que você altere a visibilidade deles após criá-los.
  8. Na barra de navegação superior, selecione <region-1> e, na lista de regiões, selecione <region-2>. Por exemplo, alterne para US East (Ashburn).
  9. Repita as etapas anteriores para criar bucket-2 em <region-2>.
Você criou com sucesso dois buckets privados em duas regiões diferentes.
Obter o Namespace da Tenancy

Cada tenancy tem um nome exclusivo de namespace imutável gerado pelo sistema. Esse nome de namespace é o mesmo em todas as regiões. Nesta etapa, você copia esse nome de namespace e, posteriormente, o utiliza para registrar seus buckets nas sessões de notebook.

  1. Abra o menu de navegação e selecione Armazenamento. Em Object Storage e Archive Storage, clique em Buckets.
  2. Na navegação à esquerda, em Escopo da Lista, selecione o compartimento data-science-work.
  3. Na barra de navegação superior, selecione <region-2>. Por exemplo, US East (Ashburn).
  4. Na lista de buckets, selecione bucket-2.
  5. Copie o Namespace em um bloco de notas: <tenancy-namespace>.
    Observação

    Os nomes de namespace são exclusivos em uma tenancy. Se bucket-1 e bucket-2 estiverem em tenancies diferentes, copie os nomes de namespace para ambos os buckets.

2. Publicar um Ambiente Conda na Região 1

Instale um ambiente conda na sessão de notebook. Em seguida, na sessão de notebook, publique o ambiente conda em um bucket.

Registrar bucket-1

Registre o bucket-1 em my-first-notebook-session.

  1. Na barra de navegação superior da Console, selecione <region-1>.
  2. Na navegação à esquerda, em Escopo da Lista, selecione o compartimento data-science-work.
  3. Abra o menu de navegação e selecione Análise e IA. Em Machine Learning, selecione Data Science.
  4. Na lista de projetos, selecione Initial Project.
  5. Selecionemy-first-notebook-session e clique em Abrir.
  6. Informe suas credenciais para acessar o notebook interativo JupyterLab.
  7. Na IU, se não houver uma guia chamada Launcher, clique em File e em New Launcher.
  8. No Iniciador, em Outros, selecione o ícone Terminal para iniciar uma nova sessão de terminal.
  9. No terminal, digite o comando a seguir.

    Substitua <tenancy-namespace> pelas informações coletadas na seção Criar Buckets.

    odsc conda init -b bucket-1 -n <tenancy-namespace>
                                    
  10. Vá para Arquivo e selecione Abrir no Caminho.... No campo Abrir Caminho, digite /conda.
  11. Para confirmar se o comando anterior registrou seu bucket no seu notebook, na pasta conda, clique em config.yaml e localize bucket-1 e seu namespace no seguinte bloco de código:
    auth_mode: resource_principal
    bucket_info:
      name: bucket-1
      namespace: <tenancy-namespace>
    pack_prefix: conda_environments
Instalar um Ambiente Conda

Em sua sessão de notebook, instale um ambiente conda do serviço Data Science criado anteriormente.

  1. Em my-first-notebook-session, clique em File e, em seguida, em New Launcher.
  2. No Launcher, em Extensions, selecione o ícone Environment Explorer.
  3. Na lista de Ambientes Conda, expanda ONNX 1.10 para CPU com Python 3.9.
  4. Copie o comando para instalar o ONNX 1.10 for CPU on Python 3.9 e cole-o em um terminal:
    odsc conda install -s onnx110_p39_cpu_v1 
    • Para o número da versão, mantenha o valor padrão exibido, como 1.0.
    • Exemplo de saída:
      Version number [1.0]? 
      Environment slug: onnx110_p39_cpu_v1
      INFO:ODSC:Verifying that /home/datascience/conda/onnx110_p39_cpu_v1 exists.
      INFO:ODSC:Downloading conda pack onnx110_p39_cpu_v1...
      INFO:ODSC:Writing to /home/datascience/.onnx110_p39_cpu_v1.tar.gz
      Downloading pack onnx110_p39_cpu_v1: 100% ...INFO:ODSC:download complete
      INFO:ODSC:Extracting conda pack /home/datascience/.onnx110_p39_cpu_v1.tar.gz...
      INFO:ODSC:Downloading Notebooks for the pack: ONNX 1.10 for CPU on Python 3.9
      INFO:ODSC:Checking for notebooks with prefix notebooks/onnx110_p39_cpu_v1/
      Saving Notebooks:   0%|                                                                                       | 0/1 [00:00<?, ?it/s]INFO:ODSC:Notebook location /home/datascience/conda/notebooks/onnx110_p39_cpu_v1/getting-started.ipynb...
      Saving Notebooks: 100%| 1/1 [00:00<00:00,  8.28it/s]
      INFO:ODSC:Start to update the kernel name...
      INFO:ODSC:Conda environment setup complete.
      The environment setup is complete. 
      To activate it for use in the terminal run `conda activate /home/datascience/conda/onnx110_p39_cpu_v1`. 
      It may take a few seconds for the kernel to appear in the JupyterLab launcher. 
      To change the description of the environment, update /home/datascience/conda/onnx110_p39_cpu_v1/*_manifest.yaml. 
  5. Verifique se o pacote está instalado:
    odsc conda list -l

    Exemplo de saída:

    packages:
      local_ONNX_1.10_for_CPU_on_Python_3.9_1.0:
      - arch_type: CPU
        conda_name: onnx110_p39_cpu_v1
        description: 'This environment is designed to provided to test and execute your
          ONNX model artifacts. ONNX is an open source, open model format which allows
          you to save a model from different machine learning (ML) libraries into a single,
          portable format that is independent of the training library. ONNX models can
          be deployed through Oracle Cloud Infrastruture Data Science Model Deployment
          service. Use this conda environment to convert models from most ML libraries
          into ONNX format. Then use the ONNX runtime to perform inferencing. Review the
          processing steps that your model makes by having ONNX generate a graph of the
          model workflow.
    
          To get started with the ONNX environment, review the getting-started notebook.
    
          '
        libraries:
        - onnx (v1.10.2)
        - onnxconverter-common (v1.9.0)
        - onnxmltools (v1.10.0)
        - onnxruntime (v1.10.0)
        - oracle-ads (v2.6.1)
        logo: onnx
        manifest_version: '1.0'
        name: ONNX 1.10 for CPU on Python 3.9
        notebooks:
        - notebooks/onnx110_p39_cpu_v1/
        pack_path: oci://service-conda-packs@id19sfcrra6z/service_pack/cpu/ONNX_1.10_for_CPU_on_Python_3.9/1.0/onnx110_p39_cpu_v1
        python: '3.9'
        slug: onnx110_p39_cpu_v1
        type: local
        version: '1.0'
  6. No Explorador de Ambientes, selecione o ícone de atualização.
  7. Selecione o link Ambientes Conda Instalados.
  8. Na lista de Ambientes Conda, confirme se ONNX 1.10 for CPU on Python 3.9 está listado.
  9. Agora, selecione File e New Launcher. Na seção Kernels, localize seu ambiente conda publicado, ONNX 1.10 for CPU on Python 3.9, listado como um ícone.
Você instalou com sucesso um ambiente conda na sua sessão de notebook em <region-1>.
Publicar o Ambiente Conda

Publique o ambiente conda em um bucket registrado na sessão de notebook.

  1. Em my-first-notebook-session, no Explorador de Ambientes, selecione Ambientes Conda Instalados.
  2. Expanda ONNX 1.10 para CPU em Python 3.9.
  3. Copie o comando para publicar ONNX 1.10 for CPU on Python 3.9:
  4. Copie o comando para publicar ONNX 1.10 for CPU on Python 3.9 e cole o comando de publicação em um terminal em sua sessão de notebook e clique em Enter.
    odsc conda publish -s onnx110_p39_cpu_v1

    Exemplo de saída:

    INFO:ODSC:Saving onnx110_p39_cpu_v1
    INFO:ODSC:Loading environment information from /home/datascience/conda/onnx110_p39_cpu_v1/ONNX_1.10_for_CPU_on_Python_3.9_manifest.yaml.
    INFO:ODSC:Overwriting manifest file at /home/datascience/conda/onnx110_p39_cpu_v1/ONNX_1.10_for_CPU_on_Python_3.9_manifest.yaml with latest dependency information
    /opt/conda/lib/python3.8/site-packages/conda_pack/core.py:56:
    ...
    INFO:ODSC:Saving conda environment to object storage: {'name': 'bucket-1', 'namespace': '<tenancy-namespace>'}
    INFO:ODSC:The upload id is <some-id>.
    ...
    INFO:ODSC:/home/datascience/conda/tmp/onnx110_p39_cpu_v1.tar.gz uploaded successfuly..
    INFO:ODSC:Conda env saved...
  5. No Explorador de Ambientes, selecione atualizar.
  6. Selecione o link Ambientes Conda Publicados.
  7. Na lista de Ambientes Conda, confirme se ONNX 1.10 for CPU on Python 3.9 está listado.
Você publicou com sucesso um ambiente conda em um bucket em <region-1>.

3. Copiar o Bucket para a Região 2

Copie seu ambiente conda publicado de bucket-1 para bucket-2.

Copiar o Conteúdo do Bucket

Seu ambiente conda publicado é armazenado como um objeto em bucket-1. Copie esse objeto para bucket-2.

  1. Abra o menu de navegação e selecione Armazenamento. Em Object Storage e Archive Storage, clique em Buckets.
  2. Na navegação à esquerda, em Escopo da Lista, selecione o compartimento data-science-work.
  3. Na barra de navegação superior, selecione <region-1>. Por exemplo, US West (Phoenix).
  4. Selecionebucket-1.
  5. Em Objetos, expanda conda_environments, cpu, ONNX 1.10 for CPU on Python 3.9 e 1.0 para chegar a onnx110_p39_cpu_v1.
  6. Selecione o menu Ações (três pontos) para onnx110_p39_cpu_v1 e clique em Copiar.
  7. Preencha as seguintes informações:
    • Nome do Destino: <tenancy-namespace>
    • Região de Destino: <region-2>, por exemplo, US East (Ashburn).
    • Bucket de Destino: bucket-2
    • Nome do Objeto de Destino: Para preservar a estrutura de diretório, mantenha a string padrão.
    • Deixe o valor padrão para outros campos:
      • Camada de Armazenamento de Destino: (deixe em branco)
      • Substituir Regra: Substituir objeto de destino
  8. Selecione Copiar Objeto.
  9. Se você receber uma seção de advertência por não ter as instruções de política de IAM corretas, selecione Tentar adicionar instruções.
    Allow service objectstorage-<region-1> to manage object-family in compartment data-science-work

    Se você não receber essa mensagem de aviso, ignore as próximas três etapas.

  10. No painel Adicionar Política do IAM, mantenha os padrões.
    • Nome: console-iam-policy-<timestamp>
    • Descrição: Instruções de política do IAM criadas pela Console em <timestamp>
    • Adicionar instrução de política ao compartimento raiz: não selecionado
    • Instruções da Política:
      Allow service objectstorage-<region-1> to manage object-family in compartment data-science-work
  11. (Opcional) Para permitir que objetos em outras regiões sejam copiados para seu compartimento, você pode adicionar a seguinte política à seção Instruções de Política no painel Adicionar Política do IAM
    Observação

    Para permitir que objetos em outras regiões sejam copiados para seu compartimento, para cada região, em uma nova linha, adicione a seguinte política à seção Instruções de Política no painel Adicionar Política do IAM:
    allow service objectstorage-<region_name> to manage object-family in compartment data-science-work
    Para a variável <region_name>, alguns valores de exemplo são:
    • objectstorage-us-phoenix-1
    • objectstorage-us-ashburn-1
    • objectstorage-eu-frankfurt-1
    • objectstorage-uk-london-1
    • objectstorage-ap-tokyo-1

    em que o object-storage-<region_name> contém o bucket de origem e executa a operação de cópia.

    Para obter uma lista completa de nomes de região, consulte a tabela na página Regiões e Domínios de Disponibilidade.

    Para obter mais detalhes sobre como copiar objetos para outras regiões, consulte Permissões de Serviço.

  12. Selecione Criar.
  13. Aguarde até receber a mensagem: Políticas adicionadas com sucesso.
  14. Selecione Copiar Objeto.
  15. Na caixa de diálogo Detalhes da Solicitação de Serviço, confirme se o Status mostra Concluído, com um Percentual Concluído de 100%. Em seguida, Feche a caixa de diálogo.
Verificar Conteúdo no Segundo Bucket

Verifique se seu ambiente conda publicado está armazenado como objeto em bucket-2.

  1. Na barra de navegação superior, selecione <region-2>. Por exemplo, US East (Ashburn).
  2. Selecionebucket-2.
  3. Em Objetos, expanda conda_environments, cpu, ONNX 1.10 for CPU on Python 3.9 e 1.0 para chegar a onnx110_p39_cpu_v1.
Você copiou com sucesso um ambiente conda publicado de bucket-1 a bucket-2.

4. Instalar o Ambiente Conda na Região 2

Registre bucket-2 em uma sessão de notebook na segunda região. Em seguida, instale e exiba o ambiente conda na sessão de notebook.

Registre o bucket-2

Registre bucket-2 em my-second-notebook-session em <region-2>.

  1. Na barra de navegação superior da Console, selecione region-2.
  2. Abra o menu de navegação e selecione Análise e IA. Em Machine Learning, selecione Data Science.
  3. Na navegação à esquerda, em Escopo da Lista, selecione o compartimento data-science-work.
  4. Na lista de projetos, selecione Second Project.
  5. Selecionemy-second-notebook-session e clique em Abrir.
  6. Informe suas credenciais para acessar a Interface do Usuário JupyterLab.
  7. Se não houver uma guia chamada Launcher, clique em File, New Launcher.
  8. No Iniciador, selecione Terminal.
  9. No terminal, digite o comando a seguir.

    Substitua <tenancy-namespace> pelas informações coletadas na seção Criar Buckets.

    odsc conda init -b bucket-2 -n <tenancy-namespace>
                                    
  10. Confirme que seu bucket está registrado no seu notebook:

    Na seção do explorador de arquivos, na pasta conda, selecione config.yaml e verifique no arquivo o seguinte código:

    auth_mode: resource_principal
    bucket_info:
      name: bucket-2
      namespace: <tenancy-namespace>
    pack_prefix: conda_environments
Instalar o Ambiente Conda Publicado

Exiba o ambiente conda copiado na sua segunda sessão de notebook.

  1. Em my-second-notebook-session, clique em File e, em seguida, em New Launcher.
  2. No Launcher, em Kernels, selecione o ícone Environment Explorer.
  3. Selecione o link Ambientes Conda Publicados.
  4. Na lista de Ambientes Conda, expanda ONNX 1.10 para CPU com Python 3.9.
    Observação

    Ter um ambiente conda publicado na sua sessão de notebook significa que:
    • O ambiente conda está disponível para instalação na sessão de notebook.
    • O ambiente conda publicado pode não estar instalado ainda.
    • Para usar o ambiente conda, você pode instalá-lo aqui.
    • O ambiente conda publicado permanece na lista de ambientes conda publicados depois que você o instala.
  5. Copie o comando para instalar o ONNX 1.10 for CPU on Python 3.9 e cole-o em um terminal:
    odsc conda install -s onnx110_p39_cpu_v1 
    • Para o número da versão, mantenha o valor padrão exibido, como 1.0.
    • Exemplo de saída:
      Version number [1.0]? 
      Environment slug: onnx110_p39_cpu_v1
      INFO:ODSC:Verifying that /home/datascience/conda/onnx110_p39_cpu_v1 exists.
      INFO:ODSC:Downloading conda pack onnx110_p39_cpu_v1...
      INFO:ODSC:Writing to /home/datascience/.onnx110_p39_cpu_v1.tar.gz
      Downloading pack onnx110_p39_cpu_v1: 100% ...INFO:ODSC:download complete
      INFO:ODSC:Extracting conda pack /home/datascience/.onnx110_p39_cpu_v1.tar.gz...
      INFO:ODSC:Downloading Notebooks for the pack: ONNX 1.10 for CPU on Python 3.9
      INFO:ODSC:Checking for notebooks with prefix notebooks/onnx110_p39_cpu_v1/
      Saving Notebooks:   0%|                                                                                       | 0/1 [00:00<?, ?it/s]INFO:ODSC:Notebook location /home/datascience/conda/notebooks/onnx110_p39_cpu_v1/getting-started.ipynb...
      Saving Notebooks: 100%| 1/1 [00:00<00:00,  8.28it/s]
      INFO:ODSC:Start to update the kernel name...
      INFO:ODSC:Conda environment setup complete.
      The environment setup is complete. 
      To activate it for use in the terminal run `conda activate /home/datascience/conda/onnx110_p39_cpu_v1`. 
      It may take a few seconds for the kernel to appear in the JupyterLab launcher. 
      To change the description of the environment, update /home/datascience/conda/onnx110_p39_cpu_v1/*_manifest.yaml. 
  6. Em um terminal, verifique se o pacote está instalado:
    odsc conda list -l

    Exemplo de saída:

    packages:
      local_ONNX_1.10_for_CPU_on_Python_3.9_1.0:
      - arch_type: CPU
        conda_name: onnx110_p39_cpu_v1
        description: 'This environment is designed to provided to test and execute your
          ONNX model artifacts. ONNX is an open source, open model format which allows
          you to save a model from different machine learning (ML) libraries into a single,
          portable format that is independent of the training library. ONNX models can
          be deployed through Oracle Cloud Infrastruture Data Science Model Deployment
          service. Use this conda environment to convert models from most ML libraries
          into ONNX format. Then use the ONNX runtime to perform inferencing. Review the
          processing steps that your model makes by having ONNX generate a graph of the
          model workflow.
    
          To get started with the ONNX environment, review the getting-started notebook.
    
          '
        libraries:
        - onnx (v1.10.2)
        - onnxconverter-common (v1.9.0)
        - onnxmltools (v1.10.0)
        - onnxruntime (v1.10.0)
        - oracle-ads (v2.6.1)
        logo: onnx
        manifest_version: '1.0'
        name: ONNX 1.10 for CPU on Python 3.9
        notebooks:
        - notebooks/onnx110_p39_cpu_v1/
        pack_path: oci://bucket-2@<tenancy-namespace>/conda_environments/cpu/ONNX 1.10 for CPU on
          Python 3.9/1.0/onnx110_p39_cpu_v1
        python: '3.9'
        slug: onnx110_p39_cpu_v1
        type: local
        version: '1.0'
  7. No Explorador de Ambientes, selecione atualizar.
  8. Selecione o link Ambientes Conda Instalados.
  9. Na lista de Ambientes Conda, confirme se ONNX 1.10 for CPU on Python 3.9 está listado.
Você instalou com sucesso um ambiente conda de uma cópia publicada em bucket-2 na sua sessão de notebook.

O Que Vem a Seguir

Você copiou com sucesso um ambiente conda de uma região para outra e o usou em uma sessão de notebook na segunda região.

Para saber mais sobre os ambientes conda, na sessão de notebook:

  • No Iniciador, em Extensões, selecione o ícone Notebook Explorer. Selecione ONNX Integration with the Accelerated Data Science (ADS) SDK, selecione Abrir e explore os exemplos.
  • Vá para o Explorador de Ambientes e instale outros ambientes conda pré-criados do serviço Data Science , não mencionados neste tutorial.