Creación de un Punto Final

Cree un punto final para un modelo personalizado, previamente entrenado o importado en un cluster de IA dedicado de alojamiento en OCI Generative AI.

Importante

Para agregar un modelo a un punto final privado, primero cree un punto final privado y, a continuación, vuelva a esta página para ver los pasos que se deben seguir para asociar el modelo.

Los puntos finales privados solo soportan modelos preentrenados y personalizados. No se admiten los modelos importados.

  • En la página de lista Puntos finales, seleccione Crear punto final. Si necesita ayuda para encontrar la página de lista, consulte List Endpoints.

    Información de punto final

    1. Seleccione un compartimento en el que crear el punto final. El compartimento por defecto es el que ha seleccionado en la página de lista, pero puede seleccionar cualquier compartimento en el que tenga permiso para trabajar.
      Consejo

      Se recomienda crear el punto final en el mismo compartimento que el modelo.
    2. (Opcional) Introduzca un nombre para el punto final. Inicie el nombre con una letra o guion bajo, seguido de letras, números, guiones o caracteres de subrayado. La longitud puede abarcar entre 1 y 255 caracteres. Si no introduce un nombre, el sistema generará un nombre que podrá cambiar posteriormente.
      El nombre generado tiene el formato generativeaiendpoint<timestamp>. Ejemplo: generativeaiendpoint20250531235319
    3. (Opcional) Introduzca una descripción para el modelo.

    Configuración de alojamiento

    1. Seleccione el compartimento al que aloja el modelo al que desea agregar un punto final.
    2. Seleccione el modelo al que desea agregar un punto final. Este modelo puede ser un modelo personalizado, importado o un modelo básico entrenado previamente listo para usar disponible en la región en la que está trabajando.
    3. Si el modelo que ha seleccionado tiene varias versiones, seleccione una versión de modelo.
      Para los modelos fundamentales preentrenados listos para usar, este campo se rellena cuando se selecciona el modelo.
    4. Seleccione un cluster de AI dedicado de alojamiento mediante una de las siguientes acciones:
      • Seleccione un cluster de IA dedicado de la lista. Si creó un cluster hace unos minutos, espere a que ese cluster se active.
      • Seleccione Crear nuevo cluster de AI dedicado y realice los siguientes pasos:
        1. (Opcional) Introduzca un nombre y una descripción.
        2. Para Modelo base, seleccione una de las siguientes opciones:
          • El modelo básico preentrenado que está alojando.
          • Si utiliza un modelo personalizado, ajustado a partir de un modelo básico, seleccione el modelo de base original en el que se entrenó.
          • Si utiliza un modelo importado, seleccione ese modelo importado.
        3. Si ha seleccionado un modelo importado, seleccione un tamaño de unidad recomendado según esta guía.
        4. Para una réplica de modelo, necesita al menos una unidad para un punto final.
        5. Lea las horas de unidad de compromiso para el cluster de AI dedicado de hosting y seleccione la casilla de control para aceptar el compromiso.
        6. (Opcional) Seleccione Agregar etiqueta y asigne etiquetas a este cluster de AI dedicado. Consulte Etiquetas de recursos.
        7. Seleccione Crear y espere a que el cluster se active.
        8. En la lista Cluster de AI dedicado, seleccione el cluster de AI dedicado que ha creado.

    Recursos de red (para modelos preentrenados y personalizados)

    Seleccione una de las opciones siguientes:
    • Punto final público
    • Punto final privado: si selecciona esta opción, seleccione el compartimento para el punto final privado y, a continuación, el punto final privado que desee utilizar. (Los modelos importados no están disponibles).
    Por defecto, los modelos importados tienen puntos finales públicos.

    Barandillas (para modelos preentrenados y personalizados)

    Nota

    Las guías no están disponibles para los modelos importados.
    1. Seleccione si desea activar las siguientes guías.
      • Moderación de contenido
        • Desactivado: no aplica la moderación de contenido ni genera contenido explícito.
        • Bloquear: ayuda a identificar y aplicar la moderación del contenido.
        • Informar: no aplique la moderación de contenido, pero tenga como objetivo informar al usuario si el modelo detecta contenido que necesita moderación.
      • Protección frente a la inyección de prompts (PI)
        • Desactivado: no aplique la protección de PI y permita entradas sin restricciones.
        • Bloquear: ayuda a identificar y proteger contra la inyección de peticiones de datos.
        • Informar: no aplique la protección de PI, pero tenga como objetivo informar al usuario si el modelo detecta contenido que necesita protección de PI.
      • Protección de información de identificación personal (PII)
        • Desactivado: no aplique protección de PII, sino contenido de salida sin restricciones de exposición de datos.
        • Bloquear: ayuda a identificar y proteger la PII, como, por ejemplo, ayuda a eliminar datos personales de las respuestas.
        • Informar: no aplique la protección de PII, pero tenga como objetivo informar al usuario si el modelo detecta contenido que necesita protección de PII.
    2. (Opcional) Seleccione Agregar etiqueta y asigne etiquetas a este punto final. Consulte Etiquetas de recursos.
    3. Seleccione Crear.
      Se le dirige a la página de detalles del punto final, donde puede realizar un seguimiento del estado del punto final.
    4. Una vez que el punto final esté activo, seleccione Ver en patio de recreo y empiece a utilizar el modelo de este punto final.
  • Utilice el comando endpoint create y los parámetros necesarios para crear un punto final:

    oci generative-ai endpoint create 
    --model-id <model-OCID>
    --compartment-id <compartment-OCID> 
    --dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
    [OPTIONS]

    Para obtener una lista completa de parámetros y valores para los comandos de la CLI, consulte la Referencia de comandos de la CLI.

    Nota

    Para los modelos entrenados previamente, en lugar de un OCID, puede utilizar el nombre del modelo exactamente como se muestra en el patio de juegos de la consola. También puede encontrar este nombre de modelo de OCI en la página de detalles del modelo en Modelos básicos previamente entrenados en IA generativa.
  • Ejecute la operación CreateEndpoint para crear un punto final.

    Nota

    Para los modelos entrenados previamente, en lugar de un OCID, puede utilizar el nombre del modelo exactamente como se muestra en el patio de juegos de la consola. También puede encontrar este nombre de modelo de OCI en la página de detalles del modelo en Modelos básicos previamente entrenados en IA generativa.