Création d'un cluster d'IA dédié dans Generative AI pour héberger des modèles

Créez une ressource de cluster d'IA dédiée dans OCI Generative AI pour héberger des adresses pour des modèles de base préentraînés et des modèles personnalisés.

Important

  • Non disponible à la demande : tous les modèles préentraînés de base d'OCI Generative AI pris en charge pour le mode de service à la demande qui utilisent les API de génération de texte et de synthèse (y compris le playground de test) sont désormais retirés. Nous vous recommandons plutôt d'utiliser les modèles de chat.
  • Peut être hébergé sur des clusters : si vous hébergez un récapitulatif ou un modèle de génération tel que cohere.command sur un cluster d'IA dédié (mode de service dédié), vous pouvez continuer à utiliser ce modèle jusqu'à son abandon. Ces modèles, lorsqu'ils sont hébergés sur un cluster d'IA dédié, sont uniquement disponibles dans le Midwest des Etats-Unis (Chicago). Reportez-vous à la section Mise hors service des modèles pour connaître les dates et définitions de sortie.
  1. Dans la barre de navigation de la console, sélectionnez une région avec l'IA générative, par exemple Midwest des Etats-Unis (Chicago) ou Sud du Royaume-Uni (Londres). Reportez-vous à les modèles proposés dans votre région.
  2. Ouvrez le menu de navigation et sélectionnez Analytiques et IA. Sous Services d'IA, sélectionnez IA générative.
  3. Sélectionnez le compartiment dans lequel héberger les modèles.
    Assurez-vous que vous disposez du droit d'accès permettant d'utiliser ou de gérer les ressources generative-ai-family et object-family dans ce compartiment.
  4. Dans le menu de gauche, sélectionnez un compartiment dans lequel vous êtes autorisé à travailler.
  5. Cliquez sur Clusters d'IA dédiés.
  6. Cliquez sur Créer un cluster d'AI dédié.
  7. Sélectionnez le compartiment dans lequel créer le cluster d'IA dédié. Le compartiment par défaut est celui que vous avez sélectionné à l'étape 3 mais vous pouvez sélectionner n'importe quel compartiment dans lequel vous êtes autorisé à travailler.
  8. (Facultatif) Saisissez un nom et une description pour le cluster. Si vous n'entrez pas de nom, le système en génère un que vous pourrez modifier ultérieurement.

    Le nom généré a le format generativeaidedicatedaicluster<horodatage>. Par exemple : generativeaidedicatedaicluster20240601202357

  9. Pour Type de cluster, cliquez sur Hébergement.
  10. Dans Modèle de base, sélectionnez le modèle de base des modèles que vous souhaitez héberger sur ce cluster. La liste des modèles inclut uniquement les modèles de base qui ne sont pas encore retirés pour le mode à la demande.
    Pour connaître la taille des unités de cluster dédiées, reportez-vous à Correspondance des modèles de base avec les clusters. Pour connaître les règles relatives à la création d'adresses pour les modèles hébergés sur les clusters, reportez-vous à Ajout d'adresses aux clusters d'hébergement.
  11. (Facultatif) Augmentez le nombre d'instances dans le champ Réplique de modèle.
    Important

    Lorsque vous créez un cluster pour héberger des modèles pour l'inférence, une unité est créée par défaut pour le modèle de base que vous sélectionnez. Pour augmenter le débit, vous pouvez augmenter le nombre d'instances dans le champ Réplique de modèle maintenant ou ultérieurement lorsque vous modifiez le cluster. Par exemple, la création de deux répliques de modèle sur ce cluster nécessite deux unités.
  12. Lisez les heures de l'unité d'engagement pour le cluster d'hébergement et cochez la case pour accepter l'engagement.
  13. (Facultatif) Cliquez sur Afficher les options avancées et affectez des balises à ce cluster.
  14. Cliquez sur Créer.
    Remarque

    La création de clusters prend quelques minutes. Une fois que le cluster est dans un état actif, vous pouvez le sélectionner pour héberger un modèle, lorsque vous créez une adresse pour ce modèle.