Creación de un punto final privado

Cree un punto final privado para un modelo personalizado o entrenado previamente en un cluster de IA dedicado de alojamiento en OCI Generative AI.

Nota

Antes de crear un punto final privado, realice los requisitos para puntos finales privados y tenga los siguientes detalles:

  • Nombre de la red virtual en la nube (VCN)
  • El nombre de la subred privada en la VCN
  • (Opcional, para Zero Trust Packet Routing (ZPR): el espacio de nombres/clave/valor de atributo de seguridad que planea asignar al punto final y una política ZPR que permite el tráfico al punto final.

Precaución

Si asigna un atributo de seguridad ZPR al punto final privado, el acceso al punto final requiere una regla de permiso de política ZPR explícita. De lo contrario, el tráfico se puede bloquear incluso si las reglas de ruta, los NSG y las listas de seguridad lo permiten.

Por defecto, un arrendamiento tiene un límite máximo de 5 puntos finales privados. Para más puntos finales privados de IA generativa, solicita un aumento en el límite, private-endpoint-count para el servicio de IA generativa.

  • En la página de lista Puntos finales privados, seleccione Crear punto final privado. Si necesita ayuda para encontrar la página de lista, consulte Listing Private Endpoints.

    Información general

    1. Seleccione un compartimento en el cual crear el punto final privado. El compartimento por defecto es el que ha seleccionado en la página de lista, pero puede seleccionar cualquier compartimento en el que tenga permiso para trabajar.
      Le recomendamos que cree el punto final privado en el mismo compartimento que el modelo que utilizará este punto final.
    2. (Opcional) Introduzca un nombre para el punto final. Inicie el nombre con una letra o guion bajo, seguido de letras, números, guiones o guiones bajos. La longitud puede abarcar de 1 a 255 caracteres. Si no se introduce un nombre, el sistema generará un nombre que podrá cambiar posteriormente.
      El nombre generado tiene el formato generativeaiprivateendpoint<timestamp>. Ejemplo: generativeaiprivateendpoint20250929212918
    3. (Opcional) Introduzca una descripción para el punto final privado.

    VCN y subred

    Seleccione la siguiente información:

    • Compartimento de VCN
    • VCN
    • Compartimento de subred privada
    • Subred privada

    Grupos de seguridad de red y DNS

    1. Introduzca un prefijo de espacio de nombres de dominio (DNS) para el FQDN.
      Una vista previa muestra el FQDN con este prefijo de DNS. Un nombre de dominio completo es un nombre único completo para un recurso de red, que se resuelve en una dirección IP específica. Por ejemplo,
      <DNS-prefix>.pe.inference.generativeai.us-chicago-1.oci.oraclecloud.com
    2. (Opcional) Seleccione si desea agregar uno o más grupos de seguridad de red seleccionando Agregar grupo de seguridad de red para cada grupo que desee agregar.
      Obtenga información sobre las reglas de seguridad.
    3. (Opcional) Seleccione un grupo a partir de la lista.
    4. (Opcional) Agregue más grupos de seguridad de red.
    5. En el flujo de creación, amplíe Mostrar atributos de seguridad y, a continuación, amplíe la opción Etiquetas que se muestra para los atributos de seguridad.
    6. Seleccione Agregar atributo de seguridad.
    7. Introduzca la siguiente información:
      • Espacio de nombres de atributo de seguridad
      • Clave de atributo de seguridad
      • Valor de atributo de seguridad
    8. Seleccione Agregar atributo de seguridad para agregar más atributos (hasta un total de 3).

      Si tiene permisos para crear un recurso, también puede que tenga permisos para agregar atributos de seguridad a ese recurso. Para agregar un atributo de seguridad, debe tener permisos para utilizar el espacio de nombres de atributo de seguridad. Para obtener más información sobre los atributos de seguridad y los espacios de nombres de atributos de seguridad, consulte Enrutamiento de paquetes de confianza cero. Si no está seguro de si desea agregar atributos de seguridad, omita esta opción o pregunte a un administrador. Puede agregar atributos de seguridad más adelante.

      Nota

      Para evitar el bloqueo involuntario del acceso, asegúrese de que las políticas de ZPR estén definidas para permitir el flujo de tráfico previsto al punto final antes de utilizar el punto final en producción. Consulte Requisitos.

    9. (Opcional) Seleccione Agregar etiqueta y asigne etiquetas a este punto final privado. Consulte Etiquetas de recursos.
    10. Seleccione Crear.

    Utilice este punto final para modelos a demanda

    Por defecto, este punto final privado está disponible para los modelos alojados en clusters de IA dedicados. Si desea que este punto final también esté disponible para los modelos a demanda que se ofrecen en el servicio de IA generativa, realice este paso:
    1. Seleccione Permitir uso en modo bajo demanda.
    2. Consulte el Consejo al final de esta sección sobre cómo llegar al modelo bajo demanda.
    Importante

    Para acceder a un modelo de IA generativa a través de este punto final privado, consulte Adición de un modelo a un punto final privado.

    Crear el punto final

    1. (Opcional) Seleccione Agregar etiqueta y asigne etiquetas a este punto final privado. Consulte Etiquetas de recursos.
    2. Seleccione Crear.
    Consejo

    Para utilizar este punto final privado para acceder a un modelo bajo demanda, cree una instancia informática en la subred privada asignada al punto final privado, agregue el código a la instancia informática, utilice el FQDN para el punto final privado y acceda al modelo desde esa instancia informática.
  • Utilice el comando generative-ai-private-endpoint create y los parámetros necesarios para crear un punto final privado:

    oci generative-ai generative-ai-private-endpoint create [OPTIONS] 
    [OPTIONS]

    Para obtener una lista completa de parámetros y valores para los comandos de la CLI, consulte la Referencia de comandos de la CLI.

    Nota

    Para los modelos entrenados previamente, en lugar de un OCID, puede utilizar el nombre del modelo exactamente como se muestra en el patio de juegos de la consola. También puede encontrar este nombre de modelo de OCI en la página de detalles del modelo en Offered Pretrained Foundational Models in Generative AI.
  • Ejecute la operación CreateGenerativeAiPrivateEndpoint para crear un punto final privado.