Criando um Ponto Final

Crie um ponto final público ou privado para um modelo personalizado ou pré-treinado em um cluster de IA dedicado de hospedagem na OCI Generative AI.

Importante

Para adicionar um modelo a um ponto final privado, primeiro crie um ponto final privado e depois execute a tarefa a seguir.
  • Na página da lista Pontos Finais, selecione Criar ponto final. Se precisar de ajuda para localizar a página da lista, consulte Listando Pontos Finais.

    Informações do Ponto Final

    1. Selecione um compartimento no qual criar o ponto final. O compartimento padrão é o mesmo da página de lista, mas você pode selecionar qualquer compartimento em que tenha permissão para trabalhar.
      Dica

      Recomendamos que você crie o ponto final no mesmo compartimento do modelo.
    2. (Opcional) Informe um nome para o ponto final. Inicie o nome com uma letra ou um sublinhado, seguido de letras, números, traços ou sublinhados. O tamanho pode ser de 1 a 255 caracteres. Se você não informar um nome, o sistema gerará um nome que poderá ser alterado posteriormente.
      O nome gerado tem o formato generativeaiendpoint<timestamp>. Exemplo: generativeaiendpoint20250531235319
    3. (Opcional) Informe uma descrição para o modelo.

    Configuração de hospedagem

    1. Selecione o compartimento ao qual hospeda o modelo ao qual você deseja adicionar um ponto final.
    2. Selecione o modelo ao qual deseja adicionar um ponto final. Esse modelo pode ser personalizado ou um modelo básico pré-treinado pronto para uso disponível na região em que você está trabalhando.
    3. Se o modelo selecionado tiver várias versões, selecione uma versão do modelo.
      Para os modelos básicos pré-treinados prontos para uso, esse campo é preenchido quando você seleciona o modelo.
    4. Selecione um cluster de IA dedicado de hospedagem executando uma das seguintes ações:
      • Selecione um Cluster de IA dedicado na lista. Se você criou um cluster alguns minutos atrás, aguarde até que ele se torne ativo. Certifique-se de que o modelo de base associado a esse cluster corresponda ao modelo de base do modelo ao qual você deseja adicionar um ponto final.
      • Selecione Criar novo cluster de IA dedicado e execute as seguintes etapas:
        1. (Opcional) Informe um nome e uma descrição.
        2. Selecione um Modelo base que corresponda ao modelo base do modelo que você deseja hospedar.
        3. Adicione 1 réplica de modelo ao ponto final. Ao criar um cluster, você precisa de pelo menos uma unidade para um ponto final. Para um cluster existente, você pode usar essa mesma unidade para hospedar novos pontos finais. Cada instância hospeda todos os pontos finais ativos. Aumentando a contagem de instâncias em um cluster, aumenta o número de RPMs suportados para todos os pontos finais ativos hospedados em um cluster.
        4. Leia as horas da unidade de compromisso para o cluster de IA dedicado de hospedagem e marque a caixa de seleção para concordar com o compromisso.
        5. (Opcional) Selecione Adicionar tag e designe tags a este cluster de IA dedicado. Consulte Tags de Recursos.
        6. Selecione Criar e aguarde o cluster se tornar ativo.
        7. Na lista Cluster de IA Dedicado, selecione o cluster dedicado de IA que você criou.

    Recursos de rede

    Selecione uma das seguintes opções:
    • Ponto final público
    • Ponto final privado: Se você selecionar essa opção, selecione o compartimento do ponto final privado e, em seguida, o ponto final privado que você deseja usar.

    Guardrails de proteção

    1. Selecione se deseja ativar os guardrails a seguir.
      • Moderação de conteúdo
        • Desativado: Não aplique moderação de conteúdo e gere conteúdo explícito.
        • Bloquear: Ajuda a identificar e aplicar moderação de conteúdo.
        • Informar: Não aplique moderação de conteúdo, mas informe ao usuário se o modelo detecta conteúdo que precisa de moderação.
      • Proteção contra PI (injeção de prompt)
        • Desativado: Não aplique proteção de PI e permita entrada irrestrita.
        • Bloquear: Ajuda a identificar e proteger contra injeção de prompt.
        • Informar: Não aplique a proteção de PI, mas informe ao usuário se o modelo detecta conteúdo que precisa de proteção de PI.
      • Proteção de PII (informações de identificação pessoal)
        • Desativado: Não aplique proteção de PII, em vez disso, produza conteúdo sem restrições de exposição de dados.
        • Bloquear: Ajuda a identificar e proteger PII, como ajuda a remover dados pessoais das respostas.
        • Informar: Não aplique a proteção de PII, mas informe ao usuário se o modelo detecta conteúdo que precisa de proteção de PII.
    2. (Opcional) Selecione Adicionar tag e designe tags a esse ponto final. Consulte Tags de Recursos.
    3. Selecione Criar.
      Você é direcionado para a página de detalhes do ponto final, na qual pode rastrear o estado do ponto final.
    4. Depois que o ponto final estiver ativo, selecione Exibir no playground e comece a usar o modelo desse ponto final.
  • Use o comando endpoint create e os parâmetros necessários para criar um ponto final:

    oci generative-ai endpoint create 
    --model-id <model-OCID>
    --compartment-id <compartment-OCID> 
    --dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
    [OPTIONS]

    Para obter uma lista completa de parâmetros e valores para comandos da CLI, consulte a Referência de Comandos da CLI.

    Observação

    Para modelos pré-treinados, em vez de um OCID, você pode usar o nome do modelo exatamente como listado no playground da Console. Você também pode encontrar esse nome de modelo da OCI, na página de detalhes do modelo em Modelos Fundamentais Pré-treinados na IA Generativa.
  • Execute a operação CreateEndpoint para criar um ponto final.

    Observação

    Para modelos pré-treinados, em vez de um OCID, você pode usar o nome do modelo exatamente como listado no playground da Console. Você também pode encontrar esse nome de modelo da OCI, na página de detalhes do modelo em Modelos Fundamentais Pré-treinados na IA Generativa.