Implantação de Modelo

Siga estas etapas para implantar modelos com o AI Quick Actions.

Criação de Implantação de Modelo

Você pode criar uma Implantação de Modelo a partir dos modelos básicos com a tag Ready to Deploy no Model Explorer ou com modelos ajustados. Ao criar uma Implantação de Modelo em Ações Rápidas de IA, você está criando uma Implantação de Modelo do OCI Data Science, que é um recurso gerenciado no Serviço OCI Data Science. Você pode implantar o modelo como pontos finais HTTP no OCI.

Você precisa ter a política necessária para usar a Implantação do Modelo do Data Science. Você pode selecionar a forma de computação para a implantação de modelo. Você pode configurar o registro em log para monitorar sua implantação de modelo. O registro em log é opcional, mas é altamente recomendável ajudar a solucionar erros com sua Implantação de Modelo. Você precisa ter a política necessária para ativar o registro em log. Consulte Logs de Implantação de Modelo para obter mais informações sobre logs. Na opção avançada, você pode selecionar o número de instâncias a serem implantadas e a largura de banda do Balanceador de Carga.

Consulte Implantação de Modelo em GitHub para obter mais informações e dicas sobre a implantação de modelos.

Observação

Para acessar implantações de modelo usando pontos finais privados, crie uma sessão de notebook com o tipo de rede definido como rede personalizada. A saída personalizada deve residir na mesma VCN e sub-rede que o recurso de ponto final privado.
    1. Navegue até o Explorador de Modelos.
    2. Selecione o cartão de modelo para o modelo que você deseja implantar.
    3. Selecione Implantar para implantar o modelo.
      A página Implantar modelo é exibida.
      1. Dê um nome à implantação.
      2. Selecionar uma forma de computação.
      3. Opcional: Selecione um grupo de logs.
      4. Opcional: Selecione um log de previsão e acesso.
      5. Opcional: Selecione um ponto final privado.
        Observação

        Um ponto final privado deve ser criado como pré-requisito para o recurso de implantação de modelo.

        O recurso de ponto final privado para implantação de modelo só é ativado no realm OC1. Para outros realms, crie uma solicitação de serviço para o serviço Data Science.

        A lista para selecionar e usar um ponto final privado na implantação de modelo só aparecerá na Console se existir um ponto final privado no compartimento.
      6. Selecione Mostrar opções avançadas.
      7. Atualize a contagem de instâncias e a largura de banda do Balanceador de Carga.
      8. Opcional: Em Contêiner de inferência, selecione um contêiner de inferência.
      9. Opcional: Selecione Modo de inferência.
      10. Selecione Implantar.
    4. Em Ações Rápidas de IA, selecione Implantações.
      A lista de implantações de modelo é mostrada. Para a implantação criada na etapa 3, aguarde até que o Estado do ciclo de vida se torne Ativo antes de clicar nele para usá-lo.
    5. Role para exibir a Janela de Referência.
    6. Digite o texto em Prompt para testar o modelo.
    7. (Opcional) Ajuste os parâmetros do modelo conforme apropriado.
    8. Selecione Gerar.
      A saída é exibida em Resposta.
  • Para obter uma lista completa de parâmetros e valores para comandos da CLI do AI Quick Actions, consulte CLI do AI Quick Actions.

  • Não é possível executar essa tarefa usando a API.

Chamar Implantação de Modelo em Ações Rápidas do AI

Você pode chamar a implantação de modelo no AI Quick Actions na CLI ou no Python SDK.

Para obter mais informações, consulte a seção sobre dicas de implantação de modelo em GitHub.

Artefatos de Modelo

Onde encontrar artefatos de modelo.

Quando um modelo é baixado em uma instância de Implantação de Modelo, ele é baixado na pasta /opt/ds/model/deployed_model/<object_storage_folder_name_and_path> .