Criando um Ponto Final Privado

Crie um ponto final privado para um modelo personalizado ou pré-treinado em um cluster de IA dedicado de hospedagem na OCI Generative AI.

Observação

Antes de criar um ponto final privado, execute os Pré-requisitos para Pontos Finais Privados e tenha os seguintes detalhes:

  • O nome da VCN (Rede Virtual na Nuvem)
  • O nome da sub-rede privada na VCN

Por padrão, uma tenancy tem um limite máximo de 5 pontos finais privados. Para mais pontos finais privados do serviço Generative AI, solicite um aumento no limite, private-endpoint-count, para o serviço Generative AI.

  • Na página da lista Pontos Finais Privados, selecione Criar ponto final privado. Se precisar de ajuda para localizar a página de lista, consulte Listando Pontos Finais Privados.

    Informações gerais

    1. Selecione um compartimento para criar um ponto final privado. O compartimento padrão é o mesmo da página de lista, mas você pode selecionar qualquer compartimento em que tenha permissão para trabalhar.
      Recomendamos que você crie o ponto final privado no mesmo compartimento do modelo que usará esse ponto final.
    2. (Opcional) Digite um nome para o ponto final. Inicie o nome com uma letra ou sublinhado, seguido de letras, números, hifens ou sublinhados. O comprimento pode ser de 1 a 255 caracteres. Se você não informar um nome, o sistema irá gerar um nome que você poderá alterar posteriormente.
      O nome gerado tem o formato generativeaiprivateendpoint<timestamp>. Exemplo: generativeaiprivateendpoint20250929212918
    3. (Opcional) Informe uma descrição para o modelo.

    VCN e Sub-rede

    Informe o seguinte:

    • Compartimento da VCN
    • VCN
    • Compartimento de sub-rede privada
    • Sub-rede privada

    Grupo de Segurança de Rede e DNS

    1. Informe um prefixo de DNS (namespace) de domínio para o FQDN.
      Uma visualização exibe o FQDN com este prefixo de DNS. Um nome de domínio totalmente qualificado é um nome exclusivo completo para um recurso de rede, que é resolvido para um endereço IP específico. Por exemplo,
      <DNS-prefix>.pe.inference.generativeai.us-chicago-1.oci.oraclecloud.com
    2. (Opcional) Selecione se um ou mais grupos de segurança de rede devem ser adicionados selecionando Adicionar grupo de segurança de rede para cada grupo que você deseja adicionar.
      Saiba mais sobre Regras de Segurança.
    3. (Opcional) Selecione um Grupo de Segurança de Rede na lista.
    4. (Opcional) Adicione mais grupos de segurança de rede.
    5. (Opcional) Selecione Adicionar tag e designe tags a esse ponto final privado. Consulte Tags de Recursos.
    6. Selecione Criar.

    Usar este Ponto Final para Modelos Sob Demanda

    Por padrão, esse ponto final privado está disponível para modelos hospedados em clusters de IA dedicados. Se você quiser que esse ponto final também esteja disponível para modelos sob demanda oferecidos no serviço Generative AI, execute esta etapa:
    1. Selecione Permitir Uso no Modo Sob Demanda.
    2. Consulte a Dica no final desta seção sobre como alcançar o modelo sob demanda.
    Importante

    Para acessar um modelo do serviço Generative AI por meio desse ponto final privado, consulte Adicionando um Modelo a um Ponto Final Privado.

    Criar o Ponto Final

    1. (Opcional) Selecione Adicionar tag e designe tags a esse ponto final privado. Consulte Tags de Recursos.
    2. Selecione Criar.
    Dica

    Para usar esse ponto final privado para acessar um modelo sob demanda, crie uma instância do serviço Compute na sub-rede privada alocada para o ponto final privado, adicione seu código à instância do serviço Compute, use o FQDN para o ponto final privado e acesse o modelo dessa instância do serviço Compute.
  • Use o comando generative-ai-private-endpoint create e os parâmetros necessários para criar um ponto final privado:

    oci generative-ai generative-ai-private-endpoint create [OPTIONS] 
    [OPTIONS]

    Para obter uma lista completa de parâmetros e valores para comandos da CLI, consulte a Referência de Comandos da CLI.

    Observação

    Para modelos pré-treinados, em vez de um OCID, você pode usar o nome do modelo exatamente como listado no playground da Console. Você também pode encontrar esse nome de modelo da OCI, na página de detalhes do modelo em Modelos Básicos Pré-treinados Oferecidos na IA Generativa.
  • Execute a operação CreateGenerativeAiPrivateEndpoint para criar um ponto final privado.