Création d'un point d'extrémité

Créez un point d'extrémité public ou privé pour un modèle personnalisé ou préentraîné sur une grappe d'IA dédiée à l'hébergement dans l'IA générative OCI.

Important

Pour ajouter un modèle à un point d'extrémité privé, créez d'abord un point d'extrémité privé, puis effectuez la tâche suivante.
  • Dans la page de liste Points d'extrémité, sélectionnez Créer un point d'extrémité. Si vous avez besoin d'aide pour trouver la page de liste, voir Liste des points d'extrémité.

    Informations sur le point d'extrémité

    1. Sélectionnez un compartiment dans lequel créer le point d'extrémité. Le compartiment par défaut est le même que la page de liste, mais vous pouvez sélectionner tout compartiment que vous êtes autorisé à utiliser.
      Conseil

      Il est recommandé de créer le point d'extrémité dans le même compartiment que le modèle.
    2. (Facultatif) Entrez un nom pour le point d'extrémité. Commencez le nom par une lettre ou un trait de soulignement, suivi de lettres, de chiffres, de tirets ou de traits de soulignement. Il peut comporter de 1 à 255 caractères. Si vous n'entrez pas de nom, le système génère un nom que vous pourrez modifier plus tard.
      Le nom généré a le format generativeaiendpoint<timestamp>. Exemple : generativeaiendpoint20250531235319
    3. (Facultatif) Entrez la description du modèle.

    Configuration d'hébergement

    1. Sélectionnez le compartiment qui héberge le modèle auquel vous voulez ajouter un point d'extrémité.
    2. Sélectionnez le modèle auquel vous voulez ajouter un point d'extrémité. Ce modèle peut être un modèle personnalisé ou un modèle de base préentraîné prêt à l'emploi disponible dans la région dans laquelle vous travaillez.
    3. Si le modèle que vous avez sélectionné comporte plusieurs versions, sélectionnez-en une.
      Pour les modèles de base préentraînés prêts à l'emploi, ce champ est alimenté lorsque vous sélectionnez le modèle.
    4. Sélectionnez une grappe dédiée à l'IA pour l'hébergement en effectuant l'une des actions suivantes :
      • Sélectionnez une grappe dédiée à l'IA dans la liste. Si vous avez créé une grappe il y a quelques minutes, attendez que celle-ci devienne active. Assurez-vous que le modèle de base associé à cette grappe correspond au modèle de base du modèle auquel vous voulez ajouter un point d'extrémité.
      • Sélectionnez Créer une nouvelle grappe dédiée à l'IA et effectuez les étapes suivantes :
        1. (Facultatif) Entrez un nom et une description.
        2. Sélectionnez un modèle de base correspondant au modèle de base du modèle que vous voulez héberger.
        3. Ajoutez 1 réplique de modèle au point d'extrémité. Lorsque vous créez une grappe, vous avez besoin d'au moins une unité pour un point d'extrémité. Pour un cluster existant, vous pouvez utiliser la même unité pour héberger de nouveaux points d'extrémité. Chaque instance héberge tous les points d'extrémité actifs. L'augmentation du nombre d'instances sur un cluster augmente le nombre de RPM pris en charge pour tous les points d'extrémité actifs hébergés sur un cluster.
        4. Lisez les heures de l'unité d'engagement pour la grappe d'intelligence artificielle dédiée d'hébergement et cochez la case pour accepter l'engagement.
        5. (Facultatif) Sélectionnez Ajouter un marqueur et affectez des marqueurs à cette grappe dédiée à l'IA. Voir Marqueurs de ressource.
        6. Sélectionnez Créer et attendez que la grappe devienne active.
        7. Dans la liste Grappe dédiée à l'IA, sélectionnez la grappe que vous avez créée.

    Ressources de réseau

    Sélectionnez une des options suivantes :
    • Point d'extrémité public
    • Point d'extrémité privé : Si vous sélectionnez cette option, sélectionnez le compartiment du point d'extrémité privé, puis le point d'extrémité privé à utiliser.

    Conditions de protection

    1. Indiquez si les garde-corps suivants doivent être activés.
      • Modération du contenu
        • Désactivé : N'appliquez pas de modération de contenu et ne produisez pas de contenu explicite.
        • Bloquer : Aide à identifier et à appliquer la modération de contenu.
        • Informer : Ne pas appliquer la modération de contenu, mais viser à informer l'utilisateur si le modèle détecte le contenu nécessitant une modération.
      • Protection contre l'injection d'invites
        • Désactivé : Ne pas appliquer la protection des informations personnelles et autoriser les entrées sans restriction.
        • Bloquer : Aide à identifier et à protéger contre l'injection d'invite.
        • Informer : Ne pas appliquer la protection des informations personnelles, mais viser à informer l'utilisateur si le modèle détecte le contenu nécessitant une protection des informations personnelles.
      • Protection des informations d'identification personnelle (PII)
        • Désactivé : N'appliquez pas la protection des informations d'identification personnelle, mais le contenu de sortie sans restrictions d'exposition aux données.
        • Bloquer : Permet d'identifier et de protéger les informations d'identification personnelle, telles que l'aide sur la suppression des données personnelles des réponses.
        • Informer : N'applique pas la protection des informations d'identification personnelle, mais vise à informer l'utilisateur si le modèle détecte le contenu nécessitant une protection des informations d'identification personnelle.
    2. (Facultatif) Sélectionnez Ajouter un marqueur et affectez des marqueurs à ce point d'extrémité. Voir Marqueurs de ressource.
    3. Sélectionnez Créer.
      Vous accédez à la page de détails du point d'extrémité, dans laquelle vous pouvez consulter l'état du point d'extrémité.
    4. Une fois le point d'extrémité actif, sélectionnez Voir dans le terrain de jeu et commencez à utiliser le modèle à partir de ce point d'extrémité.
  • Utilisez la commande endpoint create et les paramètres requis pour créer un point d'extrémité :

    oci generative-ai endpoint create 
    --model-id <model-OCID>
    --compartment-id <compartment-OCID> 
    --dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
    [OPTIONS]

    Pour la liste complète des paramètres et des valeurs pour les commandes de l'interface de ligne de commande, voir Informations de référence sur les commandes de l'interface de ligne de commande.

    Note

    Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le terrain de jeu de la console. Vous pouvez également trouver ce nom de modèle OCI dans la page de détails du modèle sous Modèles fondamentaux préentraînés dans l'intelligence artificielle générative.
  • Exécutez l'opération CreateEndpoint pour créer un point d'extrémité.

    Note

    Pour les modèles préentraînés, au lieu d'un OCID, vous pouvez utiliser le nom du modèle exactement comme indiqué dans le terrain de jeu de la console. Vous pouvez également trouver ce nom de modèle OCI dans la page de détails du modèle sous Modèles fondamentaux préentraînés dans l'intelligence artificielle générative.