Création d'une instance

Créez une adresse pour un modèle personnalisé, préentraîné ou importé sur un cluster d'IA dédié hébergé dans OCI Generative AI.

Important

Avis de non-responsabilité

Nos garde-corps de modération de contenu (CM) et d'injection rapide (PI) ont été évalués sur une gamme d'ensembles de données de référence multilingues. Toutefois, les performances réelles peuvent varier en fonction des langages, domaines, distributions de données et modèles d'utilisation spécifiques présents dans les données fournies par le client lorsque le contenu est généré par l'IA et peut contenir des erreurs ou des omissions. Par conséquent, il est uniquement destiné à des fins d'information et ne doit pas être considéré comme un conseil professionnel. OCI ne garantit pas que des caractéristiques de performances identiques seront observées dans tous les déploiements du monde réel. L'équipe d'OCI Responsible AI améliore continuellement ces modèles.

Nos fonctionnalités de modération de contenu ont été évaluées par rapport à RTPLX, l'un des plus grands ensembles de données d'évaluation multilingues accessibles au public, couvrant plus de 38 langues. Cependant, ces résultats doivent être interprétés avec la prudence appropriée car le contenu est généré par AI et peut contenir des erreurs ou des omissions. Les évaluations multilingues sont intrinsèquement limitées par la portée, la représentativité et les pratiques d'annotation des ensembles de données publics, et les performances observées sur RTPLX peuvent ne pas se généraliser entièrement à tous les contextes, domaines, dialectes ou modèles d'utilisation du monde réel. Ainsi, les résultats sont destinés à des fins d'information uniquement et ne doivent pas être considérés comme des conseils professionnels.

Remarque

Pour ajouter un modèle à une adresse privée, créez d'abord une adresse privée, puis revenez à cette page pour connaître les étapes d'attachement du modèle.

Les adresses privées prennent uniquement en charge les modèles préentraînés et personnalisés. Les modèles importés ne sont pas pris en charge.

  • Sur la page de liste Adresses, sélectionnez Créer une adresse. Si vous avez besoin d'aide pour trouver la page de liste, reportez-vous à Liste des adresses.

    Informations sur l'adresse

    1. Sélectionnez le compartiment dans lequel l'adresse doit être créée. Le compartiment par défaut est celui de la page de liste, mais vous pouvez sélectionner n'importe quel compartiment dans laquelle vous êtes autorisé à travailler.
      Conseil

      Nous vous recommandons de créer l'adresse dans le même compartiment que le modèle.
    2. (Facultatif) Entrez le nom de l'adresse. Commencez le nom par une lettre ou un tiret de soulignement, suivi de lettres, de chiffres, de traits d'union ou de trait de soulignement. La longueur peut être comprise entre 1 et 255 caractères. Si vous ne saisissez pas de nom, le système génère un nom que vous pourrez modifier ultérieurement.
      Le nom généré a le format generativeaiendpoint<horodatage>. Exemple : generativeaiendpoint20250531235319
    3. (Facultatif) Entrez la description du modèle.

    Configuration d'hébergement

    1. Sélectionnez le compartiment qui héberge le modèle auquel ajouter une adresse.
    2. Sélectionnez le modèle auquel ajouter une adresse. Ce modèle peut être un modèle personnalisé, un modèle importé ou un modèle de base préentraîné prêt à l'emploi disponible dans la région dans laquelle vous travaillez.
    3. Si le modèle que vous avez sélectionné comporte plusieurs versions, sélectionnez-en une.
      Pour les modèles de base préentraînés prêts à l'emploi, ce champ est renseigné lorsque vous sélectionnez le modèle.
    4. Sélectionnez un cluster d'IA dédié d'hébergement en effectuant l'une des actions suivantes :
      • Sélectionnez un cluster d'IA dédié dans la liste. Si vous avez créé un cluster il y a quelques minutes, attendez que ce cluster devienne actif.
      • Sélectionnez Créer un cluster d'IA dédié et procédez comme suit :
        1. (Facultatif) Entrez un nom et une description.
        2. Pour Modèle de base, sélectionnez l'une des options suivantes :
          • Le modèle de base préentraîné que vous hébergez.
          • Si vous utilisez un modèle personnalisé, affiné à partir d'un modèle de base, sélectionnez le modèle de base d'origine sur lequel il a été entraîné.
          • Si vous utilisez un modèle importé, sélectionnez-le.
        3. Si vous avez sélectionné un modèle importé, sélectionnez une taille d'unité recommandée en fonction de ce guide.
        4. Pour une réplique de modèle, vous avez besoin d'au moins une unité pour une adresse.
        5. Lisez les heures d'unité d'engagement pour le cluster d'IA dédié d'hébergement et cochez la case pour accepter l'engagement.
        6. (Facultatif) Sélectionnez Ajouter une balise et affectez des balises à ce cluster AI dédié. Reportez-vous à Balises de ressource.
        7. Sélectionnez Créer et attendez que le cluster devienne actif.
        8. Dans la liste Cluster d'IA dédié, choisissez le cluster d'IA dédié que vous avez créé.

    Ressources réseau (pour les modèles préentraînés et personnalisés)

    Sélectionnez l'une des options suivantes :
    • Adresse publique
    • Adresse privée : si vous sélectionnez cette option, sélectionnez le compartiment de l'adresse privée, puis celle à utiliser. (Non disponible pour les modèles importés.)
    Par défaut, les modèles importés ont des adresses publiques.

    Garde-corps (pour modèles préentraînés et personnalisés)

    Remarque

    Les garde-corps ne sont pas disponibles pour les modèles importés.
    1. Sélectionnez un paramètre pour chaque garde-corps. Pour obtenir des informations générales, reportez-vous à En savoir plus sur les garde-corps et, avant de les utiliser, reportez-vous à l'avis de non-responsabilité sur cette page.
      • Modération de contenu
        • Désactivé : aucune modération de contenu n'est appliquée.
        • Bloquer : permet de détecter le contenu qui nécessite de la modération et qui vise à bloquer la demande ou la réponse en fonction de votre configuration.
        • Informatique : ne bloque pas le contenu, mais vise à renvoyer une indication lorsque le contenu nécessitant une modération est détecté.
      • Protection d'injection d'invite
        • Désactivé : aucune protection par injection d'invite n'est appliquée.
        • Bloquer : aide à détecter les tentatives d'injection rapides et vise à bloquer la demande en fonction de votre configuration.
        • Informatique : ne bloque pas la demande, mais vise à renvoyer une indication lorsque le risque d'injection rapide est détecté.
      • Protection des informations d'identification personnelle
        • Désactivé : aucune protection d'informations d'identification personnelle n'est appliquée.
        • Bloquer : aide à détecter les informations d'identification personnelle et vise à bloquer la demande ou la réponse en fonction de votre configuration.
        • Informatique : ne bloque pas le contenu, mais vise à renvoyer une indication lorsque des informations d'identification personnelle sont détectées.
    2. (Facultatif) Sélectionnez Ajouter une balise et affectez des balises à cette adresse. Reportez-vous à Balises de ressource.
    3. Sélectionnez Create (Créer).
      Vous êtes redirigé vers la page de détails de l'adresse, qui vous permet de suivre son état.
    4. Une fois l'adresse active, sélectionnez Visualiser dans le playground de test et commencez à utiliser le modèle à partir de cette adresse.
  • Utilisez la commande endpoint create et les paramètres requis pour créer une adresse :

    oci generative-ai endpoint create 
    --model-id <model-OCID>
    --compartment-id <compartment-OCID> 
    --dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
    [OPTIONS]

    Pour obtenir la liste complète des paramètres et des valeurs des commandes de la CLI, reportez-vous à Référence des commandes de la CLI.

    Remarque

    Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le playground de test de la console. Vous pouvez également trouver ce nom de modèle OCI sur la page de détails du modèle dans Modèles de base préentraînés proposés dans l'IA générative.
  • Exécutez l'opération CreateEndpoint pour créer une adresse.

    Remarque

    Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le playground de test de la console. Vous pouvez également trouver ce nom de modèle OCI sur la page de détails du modèle dans Modèles de base préentraînés proposés dans l'IA générative.