Ajout d'un modèle à un point d'extrémité privé

Voyez comment attacher un point d'extrémité avec un modèle personnalisé ou préentraîné à un point d'extrémité privé dans le service d'intelligence artificielle générative pour OCI.

Vous pouvez attacher un ou plusieurs points d'extrémité à un point d'extrémité privé.

  • Créer un point d'extrémité

    1. Dans la page de liste Points d'extrémité privés, sélectionnez le point d'extrémité privé avec lequel vous voulez travailler. Si vous avez besoin d'aide pour trouver la page de liste des points d'extrémité privés, voir Liste des points d'extrémité privés.
    2. Sélectionnez Points d'extrémité, puis Créer un point d'extrémité.

    Informations sur le point d'extrémité

    1. Sélectionnez un compartiment dans lequel créer le point d'extrémité. Le compartiment par défaut est le même que la page de liste, mais vous pouvez sélectionner tout compartiment que vous êtes autorisé à utiliser.
      Conseil

      Il est recommandé de créer le point d'extrémité dans le même compartiment que le modèle.
    2. (Facultatif) Entrez un nom pour le point d'extrémité. Commencez le nom par une lettre ou un trait de soulignement, suivi de lettres, de chiffres, de tirets ou de traits de soulignement. Il peut comporter entre 1 et 255 caractères. Si vous n'entrez pas de nom, le système génère un nom que vous pourrez modifier plus tard.
      Le nom généré a le format generativeaiendpoint<timestamp>. Exemple : generativeaiendpoint20250531235319
    3. (Facultatif) Entrez la description du modèle.

    Configuration d'hébergement

    1. Sélectionnez le compartiment qui héberge le modèle auquel vous voulez ajouter un point d'extrémité.
    2. Sélectionnez le modèle auquel vous voulez ajouter un point d'extrémité. Ce modèle peut être un modèle personnalisé ou un modèle de base préentraîné prêt à l'emploi disponible dans la région dans laquelle vous travaillez.
    3. Si le modèle que vous avez sélectionné comporte plusieurs versions, sélectionnez-en une.
      Pour les modèles de base préentraînés prêts à l'emploi, ce champ est alimenté lorsque vous sélectionnez le modèle.
    4. Sélectionnez une grappe dédiée à l'IA pour l'hébergement en effectuant l'une des actions suivantes :
      • Sélectionnez une grappe dédiée à l'IA dans la liste. Si vous avez créé une grappe il y a quelques minutes, attendez que celle-ci devienne active. Assurez-vous que le modèle de base associé à cette grappe correspond au modèle de base du modèle auquel vous voulez ajouter un point d'extrémité.
      • Sélectionnez Créer une nouvelle grappe dédiée à l'IA et effectuez les étapes suivantes :
        1. (Facultatif) Entrez un nom et une description.
        2. Sélectionnez un modèle de base qui correspond au modèle de base du modèle à héberger.
        3. Ajoutez 1 réplique de modèle au point d'extrémité. Lorsque vous créez une grappe, vous avez besoin d'au moins une unité pour un point d'extrémité. Pour un cluster existant, vous pouvez utiliser cette même unité pour héberger de nouveaux endpoints. Chaque instance héberge tous les points d'extrémité actifs. Augmenter le nombre d'instances sur une grappe augmente le nombre de RPM pris en charge pour tous les points d'extrémité actifs hébergés sur une grappe.
        4. Lisez les heures d'unité d'engagement pour la grappe dédiée à l'IA pour l'hébergement et cochez la case pour accepter l'engagement.
        5. (Facultatif) Sélectionnez Ajouter un marqueur et affectez des marqueurs à cette grappe dédiée à l'IA. Voir Marqueurs de ressource.
        6. Sélectionnez Créer et attendez que la grappe devienne active.
        7. Dans la liste Grappe dédiée à l'IA, sélectionnez la grappe que vous avez créée.

    Ressources de réseau

    Le point d'extrémité privé est présélectionné.

    Conditions de protection

    1. Indiquez si les garde-corps suivants doivent être activés.
      • Modération du contenu
        • Désactivé : N'appliquez pas de modération de contenu et ne produisez pas de contenu explicite.
        • Bloquer : Aide à identifier et à appliquer la modération de contenu.
        • Informer : Ne pas appliquer la modération de contenu, mais viser à informer l'utilisateur si le modèle détecte le contenu nécessitant une modération.
      • Protection contre l'injection d'invites
        • Désactivé : Ne pas appliquer la protection des informations personnelles et autoriser les entrées sans restriction.
        • Bloquer : Aide à identifier et à protéger contre l'injection d'invite.
        • Informer : Ne pas appliquer la protection des informations personnelles, mais viser à informer l'utilisateur si le modèle détecte le contenu nécessitant une protection des informations personnelles.
      • Protection des informations d'identification personnelle (IIP)
        • Désactivé : N'appliquez pas la protection des informations d'identification personnelle, mais le contenu de sortie sans restrictions d'exposition aux données.
        • Bloquer : Permet d'identifier et de protéger les informations d'identification personnelle, telles que l'aide sur la suppression des données personnelles des réponses.
        • Informer : N'applique pas la protection des informations d'identification personnelle, mais vise à informer l'utilisateur si le modèle détecte le contenu nécessitant une protection des informations d'identification personnelle.
    2. (Facultatif) Sélectionnez Ajouter un marqueur et affectez des marqueurs à ce point d'extrémité. Voir Marqueurs de ressource.
    3. Sélectionnez Créer.
      Vous accédez à la page de détails du point d'extrémité, dans laquelle vous pouvez consulter l'état du point d'extrémité.
  • Utilisez la commande endpoint create et les paramètres requis pour créer un point d'extrémité :

    oci generative-ai endpoint create 
    --model-id <model-OCID>
    --compartment-id <compartment-OCID> 
    --dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
    [OPTIONS]

    Pour la liste complète des paramètres et des valeurs pour les commandes de l'interface de ligne de commande, voir Informations de référence sur les commandes de l'interface de ligne de commande.

    Note

    Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le terrain de jeu de la console. Vous pouvez également trouver ce nom de modèle OCI dans la page de détails du modèle sous Modèles fondamentaux préentraînés dans l'intelligence artificielle générative.
  • Exécutez l'opération CreateEndpoint pour créer un point d'extrémité.

    Note

    Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le terrain de jeu de la console. Vous pouvez également trouver ce nom de modèle OCI dans la page de détails du modèle sous Modèles fondamentaux préentraînés dans l'intelligence artificielle générative.