Ajout d'un modèle à une adresse privée

Découvrez comment attacher une adresse avec un modèle personnalisé ou préentraîné à une adresse privée dans OCI Generative AI.

Vous pouvez attacher des adresses à une adresse privée.

  • Créer une extrémité

    1. Sur la page de liste Adresses privées, sélectionnez l'adresse privée à utiliser. Si vous avez besoin d'aide pour trouver la page de liste des adresses privées, reportez-vous à Liste des adresses privées.
    2. Sélectionnez Adresses, puis Créer une adresse.

    Informations sur l'adresse

    1. Sélectionnez le compartiment dans lequel l'adresse doit être créée. Le compartiment par défaut est celui de la page de liste, mais vous pouvez sélectionner n'importe quel compartiment dans laquelle vous êtes autorisé à travailler.
      Conseil

      Nous vous recommandons de créer l'adresse dans le même compartiment que le modèle.
    2. (Facultatif) Entrez le nom de l'adresse. Commencez le nom par une lettre ou un tiret de soulignement, suivi de lettres, de chiffres, de traits d'union ou de trait de soulignement. La longueur peut être comprise entre 1 et 255 caractères. Si vous ne saisissez pas de nom, le système génère un nom que vous pourrez modifier ultérieurement.
      Le nom généré a le format generativeaiendpoint<horodatage>. Exemple : generativeaiendpoint20250531235319
    3. (Facultatif) Entrez la description du modèle.

    Configuration d'hébergement

    1. Sélectionnez le compartiment qui héberge le modèle auquel ajouter une adresse.
    2. Sélectionnez le modèle auquel ajouter une adresse. Ce modèle peut être un modèle personnalisé ou un modèle de base préentraîné prêt à l'emploi disponible dans la région dans laquelle vous travaillez.
    3. Si le modèle que vous avez sélectionné comporte plusieurs versions, sélectionnez-en une.
      Pour les modèles de base préentraînés prêts à l'emploi, ce champ est renseigné lorsque vous sélectionnez le modèle.
    4. Sélectionnez un cluster d'IA dédié d'hébergement en effectuant l'une des actions suivantes :
      • Sélectionnez un cluster d'IA dédié dans la liste. Si vous avez créé un cluster il y a quelques minutes, attendez que ce cluster devienne actif. Assurez-vous que le modèle de base associé à ce cluster correspond au modèle de base pour le modèle auquel vous voulez ajouter une adresse.
      • Sélectionnez Créer un cluster d'IA dédié et procédez comme suit :
        1. (Facultatif) Entrez un nom et une description.
        2. Sélectionnez un modèle de base correspondant au modèle de base du modèle que vous souhaitez héberger.
        3. Ajoutez 1 réplique de modèle à l'adresse. Lorsque vous créez un cluster, vous avez besoin d'au moins une unité pour une adresse. Pour un cluster existant, vous pouvez utiliser cette même unité pour héberger de nouvelles adresses. Chaque instance héberge toutes les adresses actives. Augmentant le nombre d'instances sur un cluster, augmente le nombre de RPM pris en charge pour toutes les adresses actives hébergées sur un cluster.
        4. Lisez les heures d'unité d'engagement pour le cluster d'IA dédié d'hébergement et cochez la case pour accepter l'engagement.
        5. (Facultatif) Sélectionnez Ajouter une balise et affectez des balises à ce cluster AI dédié. Reportez-vous à Balises de ressource.
        6. Sélectionnez Créer et attendez que le cluster devienne actif.
        7. Dans la liste Cluster d'IA dédié, choisissez le cluster d'IA dédié que vous avez créé.

    Ressources de réseau

    L'adresse privée est présélectionnée.

    Glissières de sécurité

    1. Indiquez si les garde-fous suivants doivent être activés.
      • Modération de contenu
        • Désactivé : n'appliquez pas de modération de contenu et ne générez pas de contenu explicite.
        • Bloquer : aide à identifier et à appliquer la modération de contenu.
        • Informatique : n'appliquez pas la modération de contenu, mais prévoyez d'informer l'utilisateur si le modèle détecte un contenu nécessitant une modération.
      • Protection d'injection d'invite
        • Désactivé : n'appliquez pas de protection des données à caractère personnel et autorisez les entrées sans restriction.
        • Bloquer : aide à identifier et à protéger contre l'injection rapide.
        • Inform : n'appliquez pas de protection des informations personnelles, mais prévoyez d'informer l'utilisateur si le modèle détecte un contenu nécessitant une protection des informations personnelles.
      • Protection des informations d'identification personnelle
        • Désactivé : n'appliquez pas de protection des informations d'identification personnelle, mais générez du contenu sans restrictions d'exposition des données.
        • Bloquer : aide à identifier et à protéger les informations d'identification personnelle, telles que la suppression des données personnelles des réponses.
        • Informatique : n'appliquez pas de protection d'informations d'identification personnelle, mais essayez d'informer l'utilisateur si le modèle détecte un contenu nécessitant une protection d'informations d'identification personnelle.
    2. (Facultatif) Sélectionnez Ajouter une balise et affectez des balises à cette adresse. Reportez-vous à Balises de ressource.
    3. Sélectionnez Create (Créer).
      Vous êtes redirigé vers la page de détails de l'adresse, qui vous permet de suivre son état.
  • Utilisez la commande endpoint create et les paramètres requis pour créer une adresse :

    oci generative-ai endpoint create 
    --model-id <model-OCID>
    --compartment-id <compartment-OCID> 
    --dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
    [OPTIONS]

    Pour obtenir la liste complète des paramètres et des valeurs des commandes de la CLI, reportez-vous à Référence des commandes de la CLI.

    Remarque

    Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le playground de test de la console. Vous pouvez également trouver ce nom de modèle OCI sur la page de détails du modèle dans Modèles fondamentaux préentraînés dans l'IA générative.
  • Exécutez l'opération CreateEndpoint pour créer une adresse.

    Remarque

    Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le playground de test de la console. Vous pouvez également trouver ce nom de modèle OCI sur la page de détails du modèle dans Modèles fondamentaux préentraînés dans l'IA générative.