Création d'une application

Créez une application dans le service OCI Generative AI.

Les applications définissent une exécution gérée pour les déploiements hébergés, notamment le redimensionnement, le stockage géré, la mise en réseau et les paramètres d'authentification. Cette tâche décrit les étapes de création d'une application à l'aide de la console Oracle Cloud.

Conseil

Une fois que vous avez créé une application, vous pouvez visualiser ses détails et effectuer d'autres tâches, telles que sa mise à jour, son déplacement vers un autre compartiment, sa gestion des balises ou sa suppression. Utilisez le menu Actions (trois points) de la console pour accéder à ces tâches. Vous pouvez également créer des déploiements pour l'application et activer un déploiement pour en faire la version en cours d'exécution. Pour plus d'informations, reportez-vous à Liste des applications.

Pour créer une application, dans la page de liste, sélectionnez Créer une application. Si vous avez besoin d'aide pour trouver la page de liste, reportez-vous à Liste des applications.

  1. (Facultatif) Dans Variables d'environnement, ajoutez les variables d'environnement requises par le conteneur.
  2. (Facultatif) Dans Fonctions de réseau, sélectionnez le type de réseau pour le trafic sortant (sortant) et sélectionnez un type d'adresse (public ou privé) pour l'accès au déploiement actif pour cette application.
  3. Dans Authentification, sélectionnez une configuration de domaine d'identité et fournissez les paramètres OAuth requis (portée et audience).
  4. Vérifiez les paramètres et sélectionnez Créer une application.

Informations de base

  1. Attribuez un nom à l'application.
    Commencez le nom par une lettre ou un tiret de soulignement, suivi de lettres, de chiffres, de traits d'union ou de trait de soulignement. La longueur peut être comprise entre 1 et 255 caractères.
  2. (Facultatif) Entrez la description de l'application.
  3. Sélectionnez le compartiment dans lequel créer l'application. Le compartiment par défaut est celui de la page de liste, mais vous pouvez sélectionner n'importe quel compartiment dans laquelle vous êtes autorisé à travailler.

Balises

  1. (Facultatif) Sélectionnez Ajouter une balise et affectez des balises à cette banque de vecteurs. Reportez-vous à Balises de ressource.
  2. Sélectionnez Create (Créer).

Redimensionnement

  1. Pour le redimensionnement automatique, vous définissez la façon dont le déploiement hébergé évolue pour gérer la charge.
    • Nombre minimal de répliques

      Maintient au moins ces nombreuses répliques en cours d'exécution à tout moment. Doit être inférieur ou égal au nombre maximum de répliques. La valeur par défaut est 1.

    • Nombre maximal de répliques

      Limite le nombre de répliques. De nouvelles répliques sont ajoutées à mesure que la charge augmente, jusqu'à cette limite. La valeur par défaut est 3 (30 au maximum). Définissez la valeur sur la réplique minimale pour désactiver le redimensionnement automatique.

  2. Sélectionnez une mesure de concurrence.
    Ce paramètre ajoute des répliques lorsque les demandes simultanées dépassent cette valeur, jusqu'au nombre maximum de répliques que vous définissez. Plage : 1–500.
    • Utilisation de l'UC (%)

      Ajoute des répliques lorsque l'utilisation de l'UC dépasse ce pourcentage, jusqu'au nombre maximal de répliques que vous définissez. Plage : 50–95 %.

    • Utilisation de la mémoire (%)

      Ajoute des répliques lorsque l'utilisation de la mémoire dépasse ce pourcentage, jusqu'au nombre maximal de répliques que vous définissez. Plage : 50–95 %.

    • Traitements simultanés

      Ajoute des répliques lorsque les demandes simultanées dépassent cette valeur, jusqu'au nombre maximum de répliques que vous définissez. Plage : 1–500.

    • Demandes par seconde (RPS)

      Maintient au moins ces nombreuses répliques en cours d'exécution à tout moment. Doit être inférieur ou égal au nombre maximum de répliques. La valeur par défaut est 1.

Stockage (facultatif)

Si l'agent doit utiliser le stockage géré par le service, vous pouvez sélectionner PostgreSQL, OCI Cache et Oracle Autonomous Database.

Activez le stockage géré pour les déploiements hébergés associés à cette application. Le stockage géré est créé et géré par le service et n'est accessible qu'à partir du déploiement hébergé associé à cette application. Les détails de connexion sont fournis au conteneur via des variables d'environnement.

  1. Si l'agent doit utiliser le stockage géré du service, activez l'une des options suivantes.
    • OCI PostgreSQL

      Activez OCI PostgreSQL pour fournir une base de données gérée pour les déploiements dans cette application.

      Dans la liste déroulante de sélection de stockage, vous verrez la liste des systèmes de base de données PostgreSQL gérés disponibles. Après avoir sélectionné un système de stockage, la console affiche la liste des applications qui utilisent actuellement ce stockage sous la liste déroulante, ce qui vous permet de comprendre quelles applications partagent le système de base de données sélectionné.

      Pour cette option :
      • Entrez le nom de variable d'environnement qui reçoit l'URI de connexion OCI PostgreSQL. Le service ajoute la chaîne de connexion à la variable d'environnement indiquée. Vous devez utiliser le même nom que le nom de la variable d'environnement dans votre code.
      • Stockage : choisissez d'en créer un ou d'en utiliser un existant. Si vous sélectionnez un stockage existant, l'application partage cette instance OCI PostgreSQL avec d'autres applications de la location. Cependant, une base de données dédiée est affectée à chaque application et celle-ci ne dispose que des droits d'accès permettant d'accéder à sa base de données dédiée.
    • Cache OCI
      Activez OCI Cache pour fournir un cache géré pour les déploiements dans cette application. Pour cette option :
      • Entrez le nom de variable d'environnement qui reçoit l'URI de connexion à OCI Cache
      • Stockage : choisissez d'en créer un ou d'en utiliser un existant.
    • Oracle Autonomous Database
      Activez Oracle Autonomous Database pour fournir une base de données gérée pour les déploiements dans cette application. Pour cette option :
      • Entrer le nom de la variable d'environnement qui reçoit l'URI de connexion à Autonomous Database
      En plus de la chaîne de connexion, le service monte les informations d'identification de l'utilisateur de base de données dans le fichier local du conteneur à l'adresse suivante :
      /mnt/secrets/adb/username
      /mnt/secrets/adb/password
  2. (Facultatif) Dans Variables d'environnement, entrez des variables d'environnement pour le déploiement.

    Si votre code doit utiliser des variables d'environnement personnalisées, vous pouvez les définir dans cette section et ces variables d'environnement sont ajoutées au profil de conteneur.

    • Texte brut

      Pour chaque variable, définissez une clé (nom de la variable d'environnement) et sa valeur.

    • Coffre OCI

      Pour chaque variable, définissez une clé (nom de la variable d'environnement) et la clé secrète dans le coffre en sélectionnant les informations suivantes :

      • Compartiment du coffre
      • Coffre
      • Clé secrète du coffre
      Le service ajoute les informations de coffre dans un conteneur en tant que fichier JSON. Exemple de code JSON :
      {
          "vaultId":<vault-ocid>,
          "key":<the secret in the vault>
      }

Mise en réseau (facultatif)

Sélectionnez le mode d'acheminement du trafic sortant (sortant) dans cette application et le mode d'accès des clients à l'adresse de déploiement.

  1. Pour Fonctions de réseau, sélectionnez l'une des options suivantes.
    • Par défaut (géré par le service)

      Permet un accès sortant aux services OCI et à l'Internet public via un réseau géré par les services.

    • Personnalisé (géré par le client)
      Achemine le trafic sortant via un VCN et un sous-réseau dans votre location à l'aide d'une connexion d'adresse privée (PE/RCE). Recommandé pour les déploiements privés intégrés à l'entreprise. Pour cette option, sélectionnez les éléments suivants :
      • Compartiment du réseau cloud virtuel
      • VCN
      • Compartiment du sous-réseau
      • Sous-réseau
      Remarque

      Si vous sélectionnez un trafic personnalisé, tout le trafic sortant est acheminé vers le sous-réseau du VCN. Si l'agent a également besoin d'un accès Internet, vous pouvez utiliser un sous-réseau public et configurer la table de routage. Reportez-vous à Passerelle Internet.
  2. Indiquez si le déploiement actif de cette application est accessible via une adresse publique ou privée.
    • Public

      Accessible depuis l'extérieur du VCN.

    • Privé

      Accessible uniquement à partir du VCN.

      Important

      Vous devez utiliser une adresse privée d'IA générative. Si vous n'en avez pas, créez une adresse privée d'IA générative.

      Sélectionnez les informations suivantes :

      • Compartiment de l'adresse privée
      • Adresse privée

    Une fois l'application créée, vous pouvez y accéder via cette adresse privée à l'aide de son nom de domaine qualifié complet ou de son adresse IP. Exemple de nom de domaine qualifié complet :

    https://<pe-name>.pe.inference.generativeai.<region>
    .oci.oraclecloud.com/20251112/hostedApplications/{your_application_ocid}

Authentification

Effectuez les tâches décrites dans Configuration de l'authentification pour le support Agentic, avant de commencer cette tâche.

  1. Sélectionnez Domaine d'identité OCI pour l'authentification.
    Ce domaine est le même que celui de l'application intégrée que vous avez créée à l'Step 2. Créez une application dans le domaine d'identité auquel elle appartient.
  2. Sélectionnez ou collez les informations sur le domaine d'identité.
    • Sélectionner un domaine d'identité existant

      Permet un accès sortant aux services OCI et à l'Internet public via un réseau géré par les services.

      • Compartiment de domaine d'identité
      • Domaine d'identité
    • Coller une URL de domaine d'identité

      Exemple : https://idcs-xxx.identity.oraclecloud.com:443

  3. Pour le domaine d'identité, entrez des valeurs pour les paramètres suivants :
    • Portée

      Spécifie les actions autorisées par le jeton d'accès (autorisations). Exemples : user.read , email.

    • Public visé

      Indique le service ou l'API auquel le jeton d'accès est destiné. Le jeton n'est accepté que lorsque la demande d'audience correspond au serveur de ressources cible.

      Pour trouver la valeur, accédez à la console de domaine d'identité et découvrez l'application intégrée que vous avez créée à l'Step 2. Créez une application dans le domaine d'identité. Sélectionnez Configuration OAuth, copiez le public principal et collez-le ici.

      Exemples :
      https://api.example.com
      https://my-service.internal
      urn:my-resource-server
      ocid1.resourceServer.oc1..xxxx

Vérifier et créer

Vérifiez les sélections et, si vous en êtes satisfait, sélectionnez Créer.

Remarque

La durée de création d'une application dépend des ressources de l'application.

  • Si le stockage géré est activé, le service provisionne une instance de stockage dédiée, ce qui peut prendre plusieurs minutes.

  • Si l'option réseau personnalisé est sélectionnée, le service provisionne les ressources de pontage réseau requises, ce qui peut également prendre plusieurs minutes.