Criando um Ponto Final Privado

Crie um ponto final privado para um modelo personalizado ou pré-treinado em um cluster de IA dedicado de hospedagem na OCI Generative AI.

Observação

Antes de criar um ponto final privado, execute os Pré-requisitos para Pontos Finais Privados e tenha os seguintes detalhes:

  • O nome da VCN (Rede Virtual na Nuvem)
  • O nome da sub-rede privada na VCN
  • (Opcional, para Zero Trust Packet Routing (ZPR)): O namespace/chave/valor do atributo de segurança que você planeja designar ao ponto final e uma política ZPR que permite o tráfego para o ponto final.

Cuidado

Se você designar um atributo de segurança ZPR ao ponto final privado, o acesso ao ponto final exigirá uma regra de permissão de política de ZPR explícita. Caso contrário, o tráfego poderá ser bloqueado mesmo que suas regras de roteamento, NSGs e listas de segurança o permitam.

Por padrão, uma tenancy tem um limite máximo de 5 pontos finais privados. Para mais pontos finais privados do serviço Generative AI, solicite um aumento no limite, private-endpoint-count, para o serviço Generative AI.

  • Na página da lista Pontos Finais Privados, selecione Criar ponto final privado. Se precisar de ajuda para localizar a página de lista, consulte Listando Pontos Finais Privados.

    Informações gerais

    1. Selecione um compartimento para criar um ponto final privado. O compartimento padrão é o mesmo da página de lista, mas você pode selecionar qualquer compartimento em que tenha permissão para trabalhar.
      Recomendamos que você crie o ponto final privado no mesmo compartimento do modelo que usará esse ponto final.
    2. (Opcional) Digite um nome para o ponto final. Inicie o nome com uma letra ou sublinhado, seguido de letras, números, hifens ou sublinhados. O comprimento pode ser de 1 a 255 caracteres. Se você não informar um nome, o sistema irá gerar um nome que você poderá alterar posteriormente.
      O nome gerado tem o formato generativeaiprivateendpoint<timestamp>. Exemplo: generativeaiprivateendpoint20250929212918
    3. (Opcional) Digite uma descrição para o ponto final privado.

    VCN e Sub-rede

    Informe o seguinte:

    • Compartimento da VCN
    • VCN
    • Compartimento de sub-rede privada
    • Sub-rede privada

    Grupo de Segurança de Rede e DNS

    1. Informe um prefixo de DNS (namespace) de domínio para o FQDN.
      Uma visualização exibe o FQDN com este prefixo de DNS. Um nome de domínio totalmente qualificado é um nome exclusivo completo para um recurso de rede, que é resolvido para um endereço IP específico. Por exemplo,
      <DNS-prefix>.pe.inference.generativeai.us-chicago-1.oci.oraclecloud.com
    2. (Opcional) Selecione se um ou mais grupos de segurança de rede devem ser adicionados selecionando Adicionar grupo de segurança de rede para cada grupo que você deseja adicionar.
      Saiba mais sobre Regras de Segurança.
    3. (Opcional) Selecione um Grupo de Segurança de Rede na lista.
    4. (Opcional) Adicione mais grupos de segurança de rede.
    5. No fluxo de criação, expanda Mostrar atributos de segurança e, em seguida, expanda a opção Tags que revela os atributos de segurança.
    6. Selecione Adicionar atributo de segurança.
    7. Digite as seguintes informações:
      • Namespace do atributo de segurança
      • Chave do atributo de segurança
      • Valor do atributo de segurança
    8. Selecione Adicionar atributo de segurança para adicionar mais atributos (até 3 no total).

      Se você tiver permissões para criar um recurso, poderá ter também permissões para adicionar atributos de segurança a esse recurso. Para adicionar um atributo de segurança, você deve ter permissões para usar o namespace do atributo de segurança. Para obter mais informações sobre atributos de segurança e namespaces de atributo de segurança, consulte Roteamento de Pacote de Confiança Zero. Se você não tiver certeza se deseja adicionar atributos de segurança, ignore essa opção ou pergunte a um administrador. Você pode adicionar atributos de segurança posteriormente.

      Observação

      Para evitar o bloqueio involuntário do acesso, certifique-se de que as políticas de ZPR estejam definidas para permitir o fluxo de tráfego pretendido para o ponto final antes de usar o ponto final na produção. Consulte Pré-requisitos.

    9. (Opcional) Selecione Adicionar tag e designe tags a esse ponto final privado. Consulte Tags de Recursos.
    10. Selecione Criar.

    Usar este Ponto Final para Modelos Sob Demanda

    Por padrão, esse ponto final privado está disponível para modelos hospedados em clusters de IA dedicados. Se você quiser que esse ponto final também esteja disponível para modelos sob demanda oferecidos no serviço Generative AI, execute esta etapa:
    1. Selecione Permitir Uso no Modo Sob Demanda.
    2. Consulte a Dica no final desta seção sobre como alcançar o modelo sob demanda.
    Importante

    Para acessar um modelo do serviço Generative AI por meio desse ponto final privado, consulte Adicionando um Modelo a um Ponto Final Privado.

    Criar o Ponto Final

    1. (Opcional) Selecione Adicionar tag e designe tags a esse ponto final privado. Consulte Tags de Recursos.
    2. Selecione Criar.
    Dica

    Para usar esse ponto final privado para acessar um modelo sob demanda, crie uma instância do serviço Compute na sub-rede privada alocada para o ponto final privado, adicione seu código à instância do serviço Compute, use o FQDN para o ponto final privado e acesse o modelo dessa instância do serviço Compute.
  • Use o comando generative-ai-private-endpoint create e os parâmetros necessários para criar um ponto final privado:

    oci generative-ai generative-ai-private-endpoint create [OPTIONS] 
    [OPTIONS]

    Para obter uma lista completa de parâmetros e valores para comandos da CLI, consulte a Referência de Comandos da CLI.

    Observação

    Para modelos pré-treinados, em vez de um OCID, você pode usar o nome do modelo exatamente como listado no playground da Console. Você também pode encontrar esse nome de modelo da OCI, na página de detalhes do modelo em Modelos Básicos Pré-treinados Oferecidos na IA Generativa.
  • Execute a operação CreateGenerativeAiPrivateEndpoint para criar um ponto final privado.