Création d'une adresse dans Generative AI

Créez une adresse pour un modèle personnalisé ou préentraîné sur un cluster d'IA dédié d'hébergement dans OCI Generative AI.

Pour obtenir les règles relatives à la création d'adresses pour les modèles hébergés sur des clusters, reportez-vous à Ajout d'adresses à des clusters hôtes.

Dans la barre de navigation de la console, sélectionnez une région avec l'IA générative, par exemple Midwest des Etats-Unis (Chicago) ou Sud du Royaume-Uni (Londres). Reportez-vous à les modèles proposés dans votre région.
Ouvrez le menu de navigation et sélectionnez Analytiques et IA. Sous Services d'IA, sélectionnez IA générative.
Sélectionnez le compartiment contenant le modèle personnalisé auquel ajouter une adresse.
Effectuez l'une des actions suivantes :
- Pour créer une adresse pour un modèle personnalisé avec le nom et la version du modèle préremplis, procédez comme suit :
  1. Sélectionnez Modèles personnalisés.
  2. Sélectionnez le nom du modèle personnalisé pour lequel ajouter une adresse.
  3. Recherchez le modèle de base du modèle personnalisé. Vous sélectionnez le modèle de base lorsque vous faites correspondre le modèle à un cluster dans les étapes suivantes.
  4. Sous Ressources, sélectionnez Adresses.
  5. Sélectionnez Créer une adresse.
- Afin de créer une adresse pour un modèle de base préentraîné prêt à l'emploi ou un modèle personnalisé, procédez comme suit :
  1. Sélectionnez Adresses.
  2. Sélectionnez Créer une adresse.
(Facultatif) Entrez le nom de l'adresse. Commencez le nom par une lettre ou un trait de soulignement, suivi de lettres, de chiffres, de traits d'union ou de traits de soulignement. Il peut comporter entre 1 et 255 caractères. Si vous n'entrez pas de nom, le système génère un nom que vous pourrez modifier ultérieurement.

Le nom généré a le format generativeaiendpoint<horodatage>.

generativeaiendpoint20240531235319
Si cette option n'est pas sélectionnée, sélectionnez le nom et la version du modèle pour lesquels vous voulez ajouter une adresse.
Conseil
- Si le modèle se trouve dans un compartiment différent du compartiment en cours, sélectionnez Modifier le compartiment et sélectionnez le compartiment qui héberge le modèle. Nous vous recommandons de créer l'adresse dans le même compartiment que le modèle.
- Si le modèle personnalisé que vous recherchez n'est pas répertorié, sélectionnez Annuler. Ensuite, sous IA générative, sélectionnez Modèles personnalisés et assurez-vous que le modèle personnalisé est à l'état actif.
Sélectionnez un cluster d'IA dédié d'hébergement en effectuant l'une des actions suivantes :
- Si vous disposez déjà d'un cluster, sélectionnez un cluster d'intelligence artificielle dédié dans la liste déroulante. Si vous venez de créer un cluster, attendez qu'il devienne actif. Assurez-vous que le modèle de base associé à ce cluster correspond au modèle de base du modèle personnalisé.
- Pour créer un cluster, dans la liste déroulante Cluster d'IA dédié, sélectionnez Créer un cluster d'IA dédié et procédez comme suit :
  1. (Facultatif) Entrez un nom et une description.
  2. Sélectionnez un modèle de base qui correspond au modèle de base du modèle que vous souhaitez héberger.
  3. Ajoutez 1 réplique de modèle à l'adresse. Lorsque vous créez un cluster, vous avez besoin d'au moins une unité pour une adresse. Pour un cluster existant, vous pouvez utiliser la même unité pour héberger de nouvelles adresses. Chaque instance héberge toutes les adresses actives. L'augmentation du nombre d'instances sur un cluster augmente le nombre de RPM pris en charge pour toutes les adresses actives hébergées sur un cluster.
  4. Lisez les heures de l'unité d'engagement pour le cluster AI dédié hébergeant et cochez la case pour accepter l'engagement.
  5. Sélectionnez Créer et attendez que le cluster devienne actif.
  6. Dans la liste déroulante Cluster d'IA dédié, sélectionnez le cluster d'IA dédié que vous avez créé.
Indiquez si les garde-corps suivants doivent être activés.
- Modération de contenu
  - Désactivé : n'applique pas de modération de contenu et ne génère pas de contenu explicite.
  - Bloquer : aide à identifier et à appliquer la modération de contenu.
  - Informe : n'applique pas de modération de contenu, mais vise à informer l'utilisateur si le modèle détecte un contenu nécessitant une modération.
- Protection d'injection d'invite
  - Désactivé : n'appliquez pas de protection des informations personnelles et n'autorisez pas la saisie sans restriction.
  - Bloquer : aide à identifier et à protéger contre l'injection d'invite.
  - Informer : n'applique pas de protection contre les informations personnelles, mais vise à informer l'utilisateur si le modèle détecte un contenu nécessitant une protection contre les informations personnelles.
- Protection des informations d'identification personnelle
  - Désactivé : n'appliquez pas de protection des informations d'identification personnelle. A la place, générez du contenu sans restrictions d'exposition des données.
  - Bloquer : aide à identifier et à protéger les informations d'identification personnelle, telles que l'aide à retirer les données personnelles des réponses.
  - Informer : n'applique pas la protection des informations d'identification personnelle, mais vise à informer l'utilisateur si le modèle détecte un contenu nécessitant une protection.
(Facultatif) Sélectionnez Afficher les options avancées et affectez des balises à l'adresse.
Sélectionnez Créer une adresse.
Vous êtes redirigé vers la page de détails de l'adresse, qui vous permet de suivre son état.
Une fois l'adresse active, sélectionnez Visualiser dans le playground de test et commencez à utiliser le modèle à partir de cette adresse.

Documentation Oracle Cloud Infrastructure

Création d'une adresse dans Generative AI