Creación de una aplicación

Cree una aplicación en el servicio OCI Generative AI.

Las aplicaciones definen un tiempo de ejecución gestionado para despliegues alojados, incluidos el escalado, el almacenamiento gestionado, las redes y la configuración de autenticación. En esta tarea se documentan los pasos para crear una aplicación mediante la consola de Oracle Cloud.

Consejo

Después de crear una aplicación, puede ver sus detalles y realizar otras tareas, como actualizarla, moverla a un compartimento diferente, gestionar sus etiquetas o suprimirla. Utilice el menú Acciones (tres puntos) de la consola para acceder a estas tareas. También puede crear uno o más despliegues para la aplicación y activar un despliegue para que sea la versión en ejecución. Para obtener más información, consulte Listado de aplicaciones.

Para crear una aplicación, en la página de lista, seleccione Crear aplicación. Si necesita ayuda para encontrar la página de lista, consulte Listado de aplicaciones.

  1. (Opcional) En Variables de entorno, agregue las variables de entorno que necesita el contenedor.
  2. (Opcional) En Red, seleccione el tipo de red para el tráfico saliente (salida) y seleccione un tipo de punto final (público o privado) para acceder al despliegue activo de esta aplicación.
  3. En Autenticación, seleccione una configuración de dominio de identidad y proporcione los valores de OAuth necesarios (ámbito y público).
  4. Revise la configuración y seleccione Crear aplicación.

Información Básica

  1. Introduzca un nombre para la aplicación.
    Inicie el nombre con una letra o guion bajo, seguido de letras, números, guiones o guiones bajos. La longitud puede abarcar de 1 a 255 caracteres.
  2. (Opcional) Introduzca una descripción para la aplicación.
  3. Seleccione el compartimento en el que desea crear la aplicación. El compartimento por defecto es el que ha seleccionado en la página de lista, pero puede seleccionar cualquier compartimento en el que tenga permiso para trabajar.

Etiquetas

  1. (Opcional) Seleccione Agregar etiqueta y asigne etiquetas a este almacén de vectores. Consulte Etiquetas de recursos.
  2. Seleccione Crear.

Escalado

  1. Para la escala automática, defina cómo se escala el despliegue alojado para manejar la carga.
    • Réplicas mínimas

      Mantiene al menos estas muchas réplicas en ejecución en todo momento. Debe ser inferior o igual a la máxima de réplicas. El valor por defecto es 1.

    • Número máximo de réplicas

      Limita el número de réplicas. Se agregan nuevas réplicas a medida que aumenta la carga, hasta este límite. El valor por defecto es 3 (30 como máximo). Definir como réplica mínima para desactivar la escala automática.

  2. Seleccione una métrica de simultaneidad.
    Esta configuración agrega réplicas cuando las solicitudes simultáneas superan este valor, hasta el máximo de réplicas que defina. Rango: de 1 a 500.
    • Uso de CPU (%)

      Agrega réplicas cuando el uso de CPU supera este porcentaje, hasta el máximo de réplicas que defina. Rango: de 50 a 95%.

    • Uso de Memoria (%)

      Agrega réplicas cuando el uso de memoria supera este porcentaje, hasta el máximo de réplicas que defina. Rango: de 50 a 95%.

    • Solicitudes simultáneas

      Agrega réplicas cuando las solicitudes simultáneas superan este valor, hasta el máximo de réplicas que defina. Rango: de 1 a 500.

    • Solicitudes por segundo (RPS)

      Mantiene al menos estas muchas réplicas en ejecución en todo momento. Debe ser menor o igual que el número máximo de réplicas. El valor por defecto es 1.

Almacenamiento (opcional)

Si el agente necesita utilizar el almacenamiento gestionado por el servicio, puede seleccionar PostgreSQL, OCI Cache y Oracle Autonomous Database.

Active el almacenamiento gestionado para los despliegues alojados asociados a esta aplicación. El servicio crea y gestiona el almacenamiento gestionado y solo se puede acceder a él desde el despliegue alojado asociado a esta aplicación. Los detalles de conexión se proporcionan al contenedor mediante variables de entorno.

  1. Si el agente necesita utilizar el almacenamiento gestionado del servicio, active una de las siguientes opciones.
    • PostgreSQL OCI

      Active OCI PostgreSQL para proporcionar una base de datos gestionada para los despliegues en esta aplicación.

      En la lista desplegable de selección de almacenamiento, verá una lista de los sistemas de base de datos PostgreSQL gestionados disponibles. Después de seleccionar un sistema de almacenamiento, la consola mostrará una lista de aplicaciones que actualmente utilizan ese almacenamiento debajo de la lista desplegable, lo que le permitirá comprender qué aplicaciones comparten el sistema de base de datos seleccionado.

      Para esta opción:
      • Introduzca el nombre de variable de entorno que recibe el URI de conexión PostgreSQL de OCI. El servicio agrega la cadena de conexión a la variable de entorno especificada. Debe utilizar el mismo nombre que el nombre de la variable de entorno en el código.
      • Almacenamiento: seleccione si desea crear uno o utilizar uno existente. Si selecciona un almacenamiento existente, la aplicación comparte esta OCI PostgreSQL con otras aplicaciones del arrendamiento. Sin embargo, a cada aplicación se le asigna una base de datos dedicada y esta aplicación solo tiene permisos para acceder a su base de datos dedicada.
    • Caché de OCI
      Active OCI Cache para proporcionar una caché gestionada para los despliegues en esta aplicación. Para esta opción:
      • Introduzca el nombre de variable de entorno que recibe el URI de conexión de OCI Cache
      • Almacenamiento: seleccione si desea crear uno o utilizar uno existente.
    • Oracle Autonomous Database
      Active Oracle Autonomous Database para proporcionar una base de datos gestionada para los despliegues en esta aplicación. Para esta opción:
      • Introduzca el nombre de variable de entorno que recibe el URI de conexión de Autonomous Database
      Además de la cadena de conexión, el servicio monta la credencial de usuario de la base de datos en el archivo local del contenedor en
      /mnt/secrets/adb/username
      /mnt/secrets/adb/password
  2. (Opcional) En Variables de entorno, introduzca una o más variables de entorno para el despliegue.

    Si el código necesita consumir variables de entorno personalizadas, puede definir esas variables en esta sección y estas variables de entorno se agregan al perfil de contenedor.

    • Texto sin formato

      Para cada variable, defina una clave (nombre de la variable de entorno) y su valor.

    • Almacén de OCI

      Para cada variable, defina una clave (nombre de variable de entorno) y el secreto en el almacén seleccionando la siguiente información:

      • Compartimento de almacén
      • Almacén
      • Secreto del almacén
      El servicio agrega la información del almacén a un contenedor como un archivo JSON. Ejemplo de código JSON:
      {
          "vaultId":<vault-ocid>,
          "key":<the secret in the vault>
      }

Redes (opcional)

Seleccione cómo enrutan los despliegues de esta aplicación el tráfico saliente (salida) y cómo acceden los clientes al punto final de despliegue.

  1. Para Red, seleccione una de las siguientes opciones.
    • Por defecto (gestionado por servicios)

      Permite el acceso saliente a los servicios de OCI y a la red pública de Internet a través de una red gestionada por servicios.

    • Personalizado (gestionado por el cliente)
      Enruta el tráfico saliente a través de una VCN y una subred de su arrendamiento mediante una conexión de punto final privado (PE/RCE). Recomendado para despliegues privados e integrados en la empresa. Para esta opción, seleccione lo siguiente:
      • Compartimento de VCN
      • VCN
      • Compartimento de subred
      • Subred
      Nota

      Si selecciona personalizado, todo el tráfico de salida se direcciona a la subred de la VCN. Si el agente también necesita acceso a Internet, puede que desee utilizar una subred pública y configurar la tabla de enrutamiento. Consulte Gateway de internet.
  2. Seleccione si se accede al despliegue activo para esta aplicación a través de un punto final público o privado.
    • Público

      Accesible desde fuera de la VCN.

    • Privado

      Accesible solo desde la VCN.

      Importante

      Debe utilizar un punto final privado de IA generativa. Si no tiene uno, cree un punto final privado de IA generativa.

      Seleccione la siguiente información:

      • Compartimento de punto final privado
      • Punto final privado

    Después de crear la aplicación, puede acceder a la aplicación a través de este punto final privado mediante su FQDN o dirección IP. Ejemplo de FQDN:

    https://<pe-name>.pe.inference.generativeai.<region>
    .oci.oraclecloud.com/20251112/hostedApplications/{your_application_ocid}

Autenticación

Realice las tareas de Configuración de la autenticación para el soporte de Agentic antes de iniciar esta tarea.

  1. Seleccione Dominio de identidad de OCI para la autenticación.
    Este dominio es el mismo dominio de identidad que la aplicación integrada que creó en el Step 2. Crear una aplicación en el dominio de identidad a la que pertenece.
  2. Seleccione o pegue la información del dominio de identidad.
    • Seleccionar un dominio de identidades existente

      Permite el acceso saliente a los servicios de OCI y a la red pública de Internet a través de una red gestionada por servicios.

      • Compartimento de dominio de identidad
      • Dominio de identidad
    • Pegar una URL de dominio de identidad

      Ejemplo: https://idcs-xxx.identity.oraclecloud.com:443

  3. Para el dominio de identidad, introduzca valores para los siguientes parámetros:
    • Ámbito

      Especifica las acciones que permite el token de acceso (permisos). Ejemplos: user.read, email.

    • Público

      Especifica a qué servicio o API está destinado el token de acceso. El token solo se acepta cuando la reclamación de público coincide con el servidor de recursos de destino.

      Para buscar el valor, vaya a la consola del dominio de identidad y descubra la aplicación integrada que ha creado en el Step 2. Cree una aplicación en el dominio de identidad. Seleccione OAuth configuración, copie Público principal y péguelo aquí.

      Ejemplos:
      https://api.example.com
      https://my-service.internal
      urn:my-resource-server
      ocid1.resourceServer.oc1..xxxx

Revisar y crear

Revise las selecciones y, si está satisfecho con ellas, seleccione Crear.

Nota

El tiempo para que se cree una aplicación depende de los recursos de la aplicación.

  • Si el almacenamiento gestionado está activado, el servicio aprovisiona una instancia de almacenamiento dedicada, que puede tardar varios minutos.

  • Si se selecciona custom networking, el servicio aprovisiona los recursos de puente de red necesarios, que también pueden tardar varios minutos.