Création d'un point d'extrémité dans le service d'intelligence artificielle générative
Créez un point d'extrémité pour un modèle personnalisé ou préentraîné dans une grappe d'hébergement dédiée à l'IA dans l'IA générative OCI.
- Dans la barre de navigation de la console, sélectionnez une région dotée de l'IA générative, par exemple, Midwest américain (Chicago) ou Royaume-Uni - Sud (Londres). Voir Quels modèles sont offerts dans votre région.
- Ouvrez le menu de navigation et sélectionnez Analyse et intelligence artificielle. Sous Services IA, sélectionnez Intelligence artificielle générative.
- Sélectionnez le compartiment qui contient le modèle personnalisé auquel vous voulez ajouter un point d'extrémité.
-
Effectuez une des actions suivantes :
- Pour créer un point d'extrémité pour un modèle personnalisé avec le nom et la version préalimentés :
- Sélectionnez Modèles personnalisés.
- Sélectionnez le nom du modèle personnalisé pour lequel vous voulez ajouter un point d'extrémité.
- Recherchez le modèle de base fondamental pour le modèle personnalisé. Dans les étapes suivantes, vous sélectionnez le modèle de base lorsque vous mettez le modèle en correspondance avec un cluster.
- Sous Ressources, sélectionnez Points d'extrémité.
- Sélectionnez Créer un point d'extrémité.
- Pour créer un point d'extrémité pour un modèle de base préentraîné prêt à l'emploi ou un modèle personnalisé :
- Sélectionner des points d'extrémité.
- Sélectionnez Créer un point d'extrémité
- Pour créer un point d'extrémité pour un modèle personnalisé avec le nom et la version préalimentés :
- (Facultatif) Entrez un nom pour le point d'extrémité. Commencez le nom par une lettre ou un trait de soulignement, suivi de lettres, de chiffres, de tirets ou de traits de soulignement. Il peut comporter de 1 à 255 caractères. Si vous n'entrez pas de nom, le système génère un nom que vous pourrez modifier plus tard.
Le nom généré a le format
generativeaiendpoint<timestamp>
.generativeaiendpoint20240531235319
-
Si cette case n'est pas cochée, sélectionnez le nom et la version du modèle pour lesquels vous voulez ajouter un point d'extrémité.
Conseil
- Si le modèle se trouve dans un compartiment différent de celui du compartiment courant, sélectionnez Changer de compartiment et sélectionnez le compartiment qui héberge le modèle. Nous vous recommandons de créer le point d'extrémité dans le même compartiment que le modèle.
- Si le modèle personnalisé que vous recherchez n'est pas listé, sélectionnez Annuler. Sous IA générative, sélectionnez Modèles personnalisés et assurez-vous que le modèle personnalisé est à l'état actif.
-
Sélectionnez une grappe d'intelligence artificielle dédiée pour l'hébergement en effectuant l'une des actions suivantes :
- Si vous avez déjà une grappe, sélectionnez une grappe dédiée à l'IA dans la liste déroulante. Si vous venez de créer une grappe, attendez que cette dernière devienne active. Assurez-vous que le modèle de base associé à cette grappe correspond au modèle de base du modèle personnalisé.
- Pour créer une grappe, dans la liste déroulante Grappe dédiée à l'IA, sélectionnez Créer une nouvelle grappe dédiée à l'IA et effectuez les étapes suivantes :
- (Facultatif) Entrez un nom et une description.
- Sélectionnez un modèle de base correspondant au modèle de base du modèle que vous voulez héberger.
- Ajoutez 1 réplique de modèle au point d'extrémité. Lorsque vous créez une grappe, vous avez besoin d'au moins une unité pour un point d'extrémité. Pour un cluster existant, vous pouvez utiliser la même unité pour héberger de nouveaux points d'extrémité. Chaque instance héberge tous les points d'extrémité actifs. L'augmentation du nombre d'instances sur un cluster augmente le nombre de RPM pris en charge pour tous les points d'extrémité actifs hébergés sur un cluster.
- Lisez les heures de l'unité d'engagement pour la grappe d'intelligence artificielle dédiée d'hébergement et cochez la case pour accepter l'engagement.
- Sélectionnez Créer et attendez que la grappe devienne active.
- Dans la liste déroulante Grappe dédiée à l'IA, sélectionnez la grappe que vous avez créée.
-
Indiquez si les garde-corps suivants doivent être activés.
- Modération du contenu
- Désactivé : N'appliquez pas de modération de contenu et ne produisez pas de contenu explicite.
- Bloquer : Aide à identifier et à appliquer la modération de contenu.
- Informer : Ne pas appliquer la modération de contenu, mais viser à informer l'utilisateur si le modèle détecte le contenu nécessitant une modération.
- Protection contre l'injection d'invites
- Désactivé : Ne pas appliquer la protection des informations personnelles et autoriser les entrées sans restriction.
- Bloquer : Aide à identifier et à protéger contre l'injection d'invite.
- Informer : Ne pas appliquer la protection des informations personnelles, mais viser à informer l'utilisateur si le modèle détecte le contenu nécessitant une protection des informations personnelles.
-
Protection des informations d'identification personnelle (PII)
- Désactivé : N'appliquez pas la protection des informations d'identification personnelle, mais le contenu de sortie sans restrictions d'exposition aux données.
- Bloquer : Permet d'identifier et de protéger les informations d'identification personnelle, telles que l'aide sur la suppression des données personnelles des réponses.
- Informer : N'applique pas la protection des informations d'identification personnelle, mais vise à informer l'utilisateur si le modèle détecte le contenu nécessitant une protection des informations d'identification personnelle.
- Modération du contenu
- (Facultatif) Sélectionnez Afficher les options avancées et affectez des marqueurs au point d'extrémité.
-
Sélectionnez Créer un point d'extrémité.
Vous accédez à la page de détails du point d'extrémité, dans laquelle vous pouvez consulter l'état du point d'extrémité.
- Une fois le point d'extrémité actif, sélectionnez Voir dans le terrain de jeu et commencez à utiliser le modèle à partir de ce point d'extrémité.