Création d'une application

Créez une application dans le service d'intelligence artificielle générative pour OCI.

Les applications définissent une exécution gérée pour les déploiements hébergés, y compris l'évolutivité, le stockage géré, le réseau et les paramètres d'authentification. Cette tâche documente les étapes de création d'une application à l'aide de la console Oracle Cloud.

Conseil

Après avoir créé une application, vous pouvez voir ses détails et effectuer d'autres tâches, telles que la mettre à jour, la déplacer vers un autre compartiment, gérer ses marqueurs ou la supprimer. Utilisez le menu Actions (trois points) de la console pour accéder à ces tâches. Vous pouvez également créer un ou plusieurs déploiements pour l'application et activer un déploiement pour en faire la version en cours d'exécution. Pour plus d'informations, voir Liste des applications.

Pour créer une application, dans la page de liste, sélectionnez Créer une application. Si vous avez besoin d'aide pour trouver la page de liste, voir Liste des applications.

  1. (Facultatif) Dans Variables d'environnement, ajoutez les variables d'environnement requises par le conteneur.
  2. (Facultatif) Dans le service Réseau, sélectionnez le type de réseau pour le trafic sortant (sortant) et sélectionnez un type de point d'extrémité (public ou privé) pour l'accès au déploiement actif pour cette application.
  3. Dans le champ Authentification, sélectionnez une configuration de domaine d'identité et fournissez les paramètres OAuth requis (portée et public).
  4. Vérifiez les paramètres et sélectionnez Créer une application.

Informations de base

  1. Entrez un nom pour l'application.
    Commencez le nom par une lettre ou un trait de soulignement, suivi de lettres, de chiffres, de tirets ou de traits de soulignement. Il peut comporter entre 1 et 255 caractères.
  2. (Facultatif) Entrez une description pour l'application.
  3. Sélectionnez un compartiment dans lequel créer l'application. Le compartiment par défaut est le même que la page de liste, mais vous pouvez sélectionner tout compartiment que vous êtes autorisé à utiliser.

Marqueurs

  1. (Facultatif) Sélectionnez Ajouter un marqueur et affectez des marqueurs à ce magasin de vecteurs. Voir Marqueurs de ressource.
  2. Sélectionnez Créer.

Ajustement

  1. Pour l'ajustement automatique, vous définissez comment le déploiement hébergé s'adapte pour gérer la charge.
    • Nombre minimal de répliques

      Maintient au moins ces nombreuses répliques en cours d'exécution à tout moment. La valeur doit être inférieure ou identique au nombre maximal de répliques. La valeur par défaut est 1.

    • Nombre maximal de répliques

      Caps le nombre de répliques. De nouvelles répliques sont ajoutées à mesure que la charge augmente, jusqu'à cette limite. La valeur par défaut est 3 (30 au maximum). Définissez une réplique égale au minimum pour désactiver l'ajustement automatique.

  2. Sélectionnez une mesure Concurrency (Concurrency).
    Ce paramètre ajoute des répliques lorsque les demandes concurrentes dépassent cette valeur, jusqu'au nombre maximal de répliques que vous avez défini. Intervalle : 1–500.
    • Utilisation d'UC (%)

      Ajoute des répliques lorsque l'utilisation d'UC dépasse ce pourcentage, jusqu'au nombre maximal de répliques que vous avez défini. Intervalle :50–95%.

    • Utilisation de mémoire (%)

      Ajoute des répliques lorsque l'utilisation de la mémoire dépasse ce pourcentage, jusqu'au nombre maximal de répliques que vous avez défini. Intervalle :50–95%.

    • Demandes concurrentes

      Ajoute des répliques lorsque les demandes concurrentes dépassent cette valeur, jusqu'au nombre maximal de répliques que vous avez défini. Intervalle : 1–500.

    • Demandes par seconde (RPS)

      Maintient au moins ces nombreuses répliques en cours d'exécution à tout moment. La valeur doit être inférieure ou identique au nombre maximal de répliques. La valeur par défaut est 1.

Stockage (facultatif)

Si l'agent doit utiliser le stockage géré du service, vous pouvez sélectionner PostgreSQL, le cache OCI et Oracle Autonomous Database.

Activer le stockage géré pour les déploiements hébergés associés à cette application. Le stockage géré est créé et géré par le service et n'est accessible qu'à partir du déploiement hébergé associé à cette application. Les détails de connexion sont fournis au conteneur au moyen de variables d'environnement.

  1. Si l'agent doit utiliser le stockage géré du service, activez l'une des options suivantes.
    • PostgreSQL pour OCI

      Activer OCI PostgreSQL pour fournir une base de données gérée pour les déploiements dans cette application.

      Dans la liste déroulante de sélection de stockage, vous verrez une liste des systèmes de base de données gérés PostgreSQL disponibles. Après avoir sélectionné un système de stockage, la console affiche une liste des applications qui utilisent actuellement ce stockage sous la liste déroulante, ce qui vous permet de comprendre quelles applications partagent le système de base de données sélectionné.

      Pour cette option :
      • Entrez le nom de la variable d'environnement qui reçoit l'URI de connexion OCI PostgreSQL. Le service ajoute la chaîne de connexion à la variable d'environnement spécifiée. Vous devez utiliser le même nom que le nom de la variable d'environnement dans votre code.
      • Stockage : Indiquez s'il faut en créer un ou utiliser un existant. Si vous sélectionnez un stockage existant, l'application partage cet OCI PostgreSQL avec d'autres applications de la location. Toutefois, une base de données dédiée est affectée à chaque application et cette application ne dispose que des autorisations pour accéder à sa base de données dédiée.
    • Cache OCI
      Activer le cache OCI pour fournir un cache géré pour les déploiements dans cette application. Pour cette option :
      • Entrez le nom de la variable d'environnement qui reçoit l'URI de connexion au cache OCI
      • Stockage : Indiquez s'il faut en créer un ou utiliser un existant.
    • Oracle Autonomous Database
      Permettre à Oracle Autonomous Database de fournir une base de données gérée pour les déploiements dans cette application. Pour cette option :
      • Entrez le nom de la variable d'environnement qui reçoit l'URI de connexion à la base de données Autonomous Database
      En plus de la chaîne de connexion, le service monte les données d'identification de l'utilisateur de la base de données dans le fichier local du conteneur à
      /mnt/secrets/adb/username
      /mnt/secrets/adb/password
  2. (Facultatif) Pour Variables d'environnement, entrez une ou plusieurs variables d'environnement pour le déploiement.

    Si votre code doit consommer des variables d'environnement personnalisées, vous pouvez définir ces variables dans cette section et ces variables d'environnement sont ajoutées au profil de conteneur.

    • Texte brut

      Pour chaque variable, définissez une clé (le nom de la variable d'environnement) et sa valeur.

    • Chambre forte OCI

      Pour chaque variable, définissez une clé (le nom de la variable d'environnement) et la clé secrète dans la chambre forte en sélectionnant les informations suivantes :

      • Compartiment de la chambre forte
      • Chambre forte
      • Clé secrète de la chambre forte
      Le service ajoute les informations de chambre forte dans un conteneur en tant que fichier JSON. Exemple de code JSON :
      {
          "vaultId":<vault-ocid>,
          "key":<the secret in the vault>
      }

Service de réseau (facultatif)

Sélectionnez la façon dont les déploiements de cette application acheminent le trafic sortant (sortant) et la façon dont les clients accèdent au point d'extrémité de déploiement.

  1. Pour Réseau, sélectionnez une des options suivantes.
    • Par défaut (géré par le service)

      Permet l'accès sortant aux services OCI et à l'Internet public au moyen d'un réseau géré par le service.

    • Personnalisé (géré par le client)
      Achemine le trafic sortant au moyen d'un VCN et d'un sous-réseau de votre location à l'aide d'une connexion de point d'extrémité privé (PE/RCE). Recommandé pour les déploiements privés et intégrés à l'entreprise. Pour cette option, sélectionnez les options suivantes :
      • Compartiment du réseau en nuage virtuel
      • VCN
      • Compartiment du sous-réseau
      • Sous-réseau
      Note

      Si vous sélectionnez Personnalisé, tout le trafic sortant est acheminé vers le sous-réseau du VCN. Si l'agent a également besoin d'un accès Internet, vous pouvez utiliser un sous-réseau public et configurer la table de routage. Voir Passerelle Internet.
  2. Indiquez si le déploiement actif de cette application est accessible au moyen d'un point d'extrémité public ou privé.

    Une fois l'application créée, vous pouvez y accéder au moyen de ce point d'extrémité privé à l'aide de son adresse IP ou de son nom de domaine complet. Exemple de nom de domaine complet :

    https://<pe-name>.pe.inference.generativeai.<region>
    .oci.oraclecloud.com/20251112/hostedApplications/{your_application_ocid}

Authentication

Effectuez des tâches dans Configuration de l'authentification pour le soutien Agentic, avant de commencer cette tâche.

  1. Sélectionnez Domaine d'identité OCI pour l'authentification.
    Ce domaine est le même domaine d'identité que l'application intégrée que vous avez créée à l'étape 2. Créer une application dans le domaine d'identité auquel appartient.
  2. Sélectionnez ou collez les informations du domaine d'identité.
    • Sélectionner un domaine d'identité existant

      Permet l'accès sortant aux services OCI et à l'Internet public au moyen d'un réseau géré par le service.

      • Compartiment de domaine d'identité
      • Domaine d'identité
    • Coller une URL de domaine d'identité

      Exemple : https://idcs-xxx.identity.oraclecloud.com:443

  3. Pour le domaine d'identité, entrez des valeurs pour les paramètres suivants :
    • Portée

      Spécifie les actions autorisées par le jeton d'accès (autorisations). Exemples : user.read, email.

    • Public

      Spécifie à quel service ou API le jeton d'accès est destiné. Le jeton est accepté uniquement lorsque la revendication d'audience correspond au serveur de ressources cible.

      Pour trouver la valeur, allez à la console du domaine d'identité et découvrez l'application intégrée que vous avez créée à l'étape 2. Créer une application dans le domaine d'identité. Sélectionnez Configuration OAuth, copiez le public principal et collez-le ici.

      Exemples :
      https://api.example.com
      https://my-service.internal
      urn:my-resource-server
      ocid1.resourceServer.oc1..xxxx

Vérifier et créer

Vérifiez les sélections et, si elles vous conviennent, sélectionnez Créer.

Note

La durée de création d'une application dépend des ressources de celle-ci.

  • Si le stockage géré est activé, le service provisionne une instance de stockage dédiée, ce qui peut prendre plusieurs minutes.

  • Si l'option Réseau personnalisé est sélectionnée, le service provisionne les ressources de pontage de réseau requises, ce qui peut également prendre plusieurs minutes.