Création d'une instance

Créez une adresse publique ou privée pour un modèle personnalisé ou préentraîné sur un cluster d'IA dédié hébergé dans OCI Generative AI.

Important

Pour ajouter un modèle à une adresse privée, créez d'abord une adresse privée, puis effectuez la tâche suivante.
  • Sur la page de liste Adresses, sélectionnez Créer une adresse. Si vous avez besoin d'aide pour trouver la page de liste, reportez-vous à Liste des adresses.

    Informations sur l'adresse

    1. Sélectionnez le compartiment dans lequel l'adresse doit être créée. Le compartiment par défaut est celui de la page de liste, mais vous pouvez sélectionner n'importe quel compartiment dans laquelle vous êtes autorisé à travailler.
      Conseil

      Nous vous recommandons de créer l'adresse dans le même compartiment que le modèle.
    2. (Facultatif) Entrez le nom de l'adresse. Commencez le nom par une lettre ou un trait de soulignement, suivi de lettres, de chiffres, de traits d'union ou de traits de soulignement. Il peut comporter entre 1 et 255 caractères. Si vous n'entrez pas de nom, le système génère un nom que vous pourrez modifier ultérieurement.
      Le nom généré a le format generativeaiendpoint<horodatage>. Exemple : generativeaiendpoint20250531235319
    3. (Facultatif) Entrez la description du modèle.

    Configuration d'hébergement

    1. Sélectionnez le compartiment qui héberge le modèle auquel ajouter une adresse.
    2. Sélectionnez le modèle auquel ajouter une adresse. Ce modèle peut être un modèle personnalisé ou un modèle de base préentraîné prêt à l'emploi disponible dans la région dans laquelle vous travaillez.
    3. Si le modèle que vous avez sélectionné comporte plusieurs versions, sélectionnez-en une.
      Pour les modèles de base préentraînés prêts à l'emploi, ce champ est renseigné lorsque vous sélectionnez le modèle.
    4. Sélectionnez un cluster d'IA dédié d'hébergement en effectuant l'une des actions suivantes :
      • Sélectionnez un cluster d'IA dédié dans la liste. Si vous avez créé un cluster il y a quelques minutes, attendez que ce cluster devienne actif. Assurez-vous que le modèle de base associé à ce cluster correspond au modèle de base pour le modèle auquel vous voulez ajouter une adresse.
      • Sélectionnez Créer un cluster d'IA dédié et procédez comme suit :
        1. (Facultatif) Entrez un nom et une description.
        2. Sélectionnez un modèle de base qui correspond au modèle de base du modèle que vous souhaitez héberger.
        3. Ajoutez 1 réplique de modèle à l'adresse. Lorsque vous créez un cluster, vous avez besoin d'au moins une unité pour une adresse. Pour un cluster existant, vous pouvez utiliser la même unité pour héberger de nouvelles adresses. Chaque instance héberge toutes les adresses actives. L'augmentation du nombre d'instances sur un cluster augmente le nombre de RPM pris en charge pour toutes les adresses actives hébergées sur un cluster.
        4. Lisez les heures de l'unité d'engagement pour le cluster AI dédié hébergeant et cochez la case pour accepter l'engagement.
        5. (Facultatif) Sélectionnez Ajouter une balise et affectez des balises à ce cluster AI dédié. Reportez-vous à Balises de ressource.
        6. Sélectionnez Créer et attendez que le cluster devienne actif.
        7. Dans la liste Cluster d'IA dédié, choisissez le cluster d'IA dédié que vous avez créé.

    Ressources de réseau

    Sélectionnez l'une des options suivantes :
    • Adresse publique
    • Adresse privée : si vous sélectionnez cette option, sélectionnez le compartiment de l'adresse privée, puis celle à utiliser.

    Glissières de sécurité

    1. Indiquez si les garde-corps suivants doivent être activés.
      • Modération de contenu
        • Désactivé : n'applique pas de modération de contenu et ne génère pas de contenu explicite.
        • Bloquer : aide à identifier et à appliquer la modération de contenu.
        • Informe : n'applique pas de modération de contenu, mais vise à informer l'utilisateur si le modèle détecte un contenu nécessitant une modération.
      • Protection d'injection d'invite
        • Désactivé : n'appliquez pas de protection des informations personnelles et n'autorisez pas la saisie sans restriction.
        • Bloquer : aide à identifier et à protéger contre l'injection d'invite.
        • Informer : n'applique pas de protection contre les informations personnelles, mais vise à informer l'utilisateur si le modèle détecte un contenu nécessitant une protection contre les informations personnelles.
      • Protection des informations d'identification personnelle
        • Désactivé : n'appliquez pas de protection des informations d'identification personnelle. A la place, générez du contenu sans restrictions d'exposition des données.
        • Bloquer : aide à identifier et à protéger les informations d'identification personnelle, telles que l'aide à retirer les données personnelles des réponses.
        • Informer : n'applique pas la protection des informations d'identification personnelle, mais vise à informer l'utilisateur si le modèle détecte un contenu nécessitant une protection.
    2. (Facultatif) Sélectionnez Ajouter une balise et affectez des balises à cette adresse. Reportez-vous à Balises de ressource.
    3. Sélectionnez Create (Créer).
      Vous êtes redirigé vers la page de détails de l'adresse, qui vous permet de suivre son état.
    4. Une fois l'adresse active, sélectionnez Visualiser dans le playground de test et commencez à utiliser le modèle à partir de cette adresse.
  • Utilisez la commande endpoint create et les paramètres requis pour créer une adresse :

    oci generative-ai endpoint create 
    --model-id <model-OCID>
    --compartment-id <compartment-OCID> 
    --dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
    [OPTIONS]

    Pour obtenir la liste complète des paramètres et des valeurs des commandes de la CLI, reportez-vous à Référence des commandes de la CLI.

    Remarque

    Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le playground de test de la console. Vous pouvez également trouver ce nom de modèle OCI sur la page de détails du modèle dans Modèles fondamentaux préentraînés dans l'IA générative.
  • Exécutez l'opération CreateEndpoint pour créer une adresse.

    Remarque

    Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le playground de test de la console. Vous pouvez également trouver ce nom de modèle OCI sur la page de détails du modèle dans Modèles fondamentaux préentraînés dans l'IA générative.