Criando um Ponto Final

Crie um ponto final para um modelo personalizado, pré-treinado ou importado em um cluster de IA dedicado de hospedagem na OCI Generative AI.

Importante

Para adicionar um modelo a um ponto final privado, primeiro crie um ponto final privado e, em seguida, retorne a esta página para obter etapas para anexar o modelo.

Os pontos finais privados suportam apenas modelos pré-treinados e personalizados. Não há suporte para modelos importados.

  • Na página da lista Pontos Finais, selecione Criar ponto final. Se precisar de ajuda para localizar a página da lista, consulte Listando Pontos Finais.

    Informações do Ponto Final

    1. Selecione um compartimento no qual criar o ponto final. O compartimento padrão é o mesmo da página de lista, mas você pode selecionar qualquer compartimento em que tenha permissão para trabalhar.
      Dica

      Recomendamos que você crie o ponto final no mesmo compartimento do modelo.
    2. (Opcional) Informe um nome para o ponto final. Inicie o nome com uma letra ou um sublinhado, seguido de letras, números, traços ou sublinhados. O tamanho pode ser de 1 a 255 caracteres. Se você não informar um nome, o sistema gerará um nome que poderá ser alterado posteriormente.
      O nome gerado tem o formato generativeaiendpoint<timestamp>. Exemplo: generativeaiendpoint20250531235319
    3. (Opcional) Informe uma descrição para o modelo.

    Configuração de hospedagem

    1. Selecione o compartimento ao qual hospeda o modelo ao qual você deseja adicionar um ponto final.
    2. Selecione o modelo ao qual deseja adicionar um ponto final. Esse modelo pode ser personalizado, importado ou pré-treinado, pronto para uso, disponível na região em que você está trabalhando.
    3. Se o modelo selecionado tiver várias versões, selecione uma versão do modelo.
      Para os modelos básicos pré-treinados prontos para uso, esse campo é preenchido quando você seleciona o modelo.
    4. Selecione um cluster de IA dedicado de hospedagem executando uma das seguintes ações:
      • Selecione um Cluster de IA dedicado na lista. Se você criou um cluster alguns minutos atrás, aguarde até que ele se torne ativo.
      • Selecione Criar novo cluster de IA dedicado e execute as seguintes etapas:
        1. (Opcional) Informe um nome e uma descrição.
        2. Para Modelo base, selecione uma das seguintes opções:
          • O modelo básico pré-treinado que você está hospedando.
          • Se estiver usando um modelo personalizado, ajustado de um modelo básico, selecione o modelo de base original (base) no qual foi treinado.
          • Se estiver usando um modelo importado, selecione esse modelo importado.
        3. Se você selecionou um modelo importado, selecione um Tamanho da unidade recomendado com base neste guia.
        4. Para a réplica do modelo, você precisa de pelo menos uma unidade para um ponto final.
        5. Leia as horas da unidade de compromisso para o cluster de IA dedicado de hospedagem e marque a caixa de seleção para concordar com o compromisso.
        6. (Opcional) Selecione Adicionar tag e designe tags a este cluster de IA dedicado. Consulte Tags de Recursos.
        7. Selecione Criar e aguarde o cluster se tornar ativo.
        8. Na lista Cluster de IA Dedicado, selecione o cluster dedicado de IA que você criou.

    Recursos de rede (para modelos pré-treinados e personalizados)

    Selecione uma das seguintes opções:
    • Ponto final público
    • Ponto final privado: Se você selecionar essa opção, selecione o compartimento do ponto final privado e, em seguida, o ponto final privado que você deseja usar. (Não disponível para modelos importados.)
    Por padrão, os modelos importados têm pontos finais públicos.

    Guardrails (para modelos pré-treinados e personalizados)

    Observação

    Os corrimãos não estão disponíveis para modelos importados.
    1. Selecione se deseja ativar os guardrails a seguir.
      • Moderação de conteúdo
        • Desativado: Não aplique moderação de conteúdo e gere conteúdo explícito.
        • Bloquear: Ajuda a identificar e aplicar moderação de conteúdo.
        • Informar: Não aplique moderação de conteúdo, mas informe ao usuário se o modelo detecta conteúdo que precisa de moderação.
      • Proteção contra PI (injeção de prompt)
        • Desativado: Não aplique proteção de PI e permita entrada irrestrita.
        • Bloquear: Ajuda a identificar e proteger contra injeção de prompt.
        • Informar: Não aplique a proteção de PI, mas informe ao usuário se o modelo detecta conteúdo que precisa de proteção de PI.
      • Proteção de PII (informações de identificação pessoal)
        • Desativado: Não aplique proteção de PII, em vez disso, produza conteúdo sem restrições de exposição de dados.
        • Bloquear: Ajuda a identificar e proteger PII, como ajuda a remover dados pessoais das respostas.
        • Informar: Não aplique a proteção de PII, mas informe ao usuário se o modelo detecta conteúdo que precisa de proteção de PII.
    2. (Opcional) Selecione Adicionar tag e designe tags a esse ponto final. Consulte Tags de Recursos.
    3. Selecione Criar.
      Você é direcionado para a página de detalhes do ponto final, na qual pode rastrear o estado do ponto final.
    4. Depois que o ponto final estiver ativo, selecione Exibir no playground e comece a usar o modelo desse ponto final.
  • Use o comando endpoint create e os parâmetros necessários para criar um ponto final:

    oci generative-ai endpoint create 
    --model-id <model-OCID>
    --compartment-id <compartment-OCID> 
    --dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
    [OPTIONS]

    Para obter uma lista completa de parâmetros e valores para comandos da CLI, consulte a Referência de Comandos da CLI.

    Observação

    Para modelos pré-treinados, em vez de um OCID, você pode usar o nome do modelo exatamente como listado no playground da Console. Você também pode encontrar esse nome de modelo da OCI, na página de detalhes do modelo em Modelos Fundamentais Pré-treinados na IA Generativa.
  • Execute a operação CreateEndpoint para criar um ponto final.

    Observação

    Para modelos pré-treinados, em vez de um OCID, você pode usar o nome do modelo exatamente como listado no playground da Console. Você também pode encontrar esse nome de modelo da OCI, na página de detalhes do modelo em Modelos Fundamentais Pré-treinados na IA Generativa.