Création d'un cluster d'IA dédié pour l'hébergement de modèle

Créez une ressource de cluster d'IA dédiée dans OCI Generative AI pour héberger des adresses pour des modèles de base préentraînés et des modèles personnalisés.

Important

  • Non disponible à la demande : tous les modèles préentraînés de base d'OCI Generative AI pris en charge pour le mode de service à la demande qui utilisent les API de génération de texte et de synthèse (y compris le playground de test) sont désormais retirés. Nous vous recommandons plutôt d'utiliser les modèles de chat.
  • Peut être hébergé sur des clusters : si vous hébergez un récapitulatif ou un modèle de génération tel que cohere.command sur un cluster d'IA dédié (mode de service dédié), vous pouvez continuer à utiliser ce modèle jusqu'à son abandon. Ces modèles, lorsqu'ils sont hébergés sur un cluster d'IA dédié, sont uniquement disponibles dans le Midwest des Etats-Unis (Chicago). Reportez-vous à la section Mise hors service des modèles pour connaître les dates et définitions de sortie.
    1. Sur la page de liste Clusters d'IA dédiés, sélectionnez Créer un cluster d'IA dédié. Si vous avez besoin d'aide pour trouver la page de liste, reportez-vous à Liste des clusters d'IA dédiés.
    2. Sélectionnez le compartiment dans lequel créer le cluster d'IA dédié. Le compartiment par défaut est celui de la page de liste, mais vous pouvez sélectionner n'importe quel compartiment dans laquelle vous êtes autorisé à travailler.
    3. (Facultatif) Saisissez un nom et une description pour le cluster. Si vous n'entrez pas de nom, le système en génère un que vous pourrez modifier ultérieurement.

      Le nom généré a le format generativeaidedicatedaicluster<horodatage>. Par exemple : generativeaidedicatedaicluster20250922181431

    4. Pour Type de cluster, sélectionnez Hébergement.
    5. Dans Modèle de base, sélectionnez le modèle de base des modèles que vous souhaitez héberger sur ce cluster. La liste des modèles inclut uniquement les modèles de base qui ne sont pas encore retirés pour le mode à la demande.
      Pour la taille d'unité de cluster dédiée et les règles relatives aux adresses des modèles hébergés sur le cluster, sélectionnez le modèle de base répertorié sur la page Modèles de base préentraînés dans l'IA générative.
    6. (Facultatif) Augmentez le nombre d'instances dans le champ Réplique de modèle.
      Important

      Lorsque vous créez un cluster pour héberger des modèles pour l'inférence, une unité est créée par défaut pour le modèle de base que vous sélectionnez. Pour augmenter le débit, vous pouvez augmenter le nombre d'instances dans le champ Réplique de modèle maintenant ou ultérieurement lorsque vous modifiez le cluster. Par exemple, la création de deux répliques de modèle sur ce cluster nécessite deux unités.
    7. Lisez les heures de l'unité d'engagement pour le cluster d'hébergement et cochez la case pour accepter l'engagement.
    8. (Facultatif) Sélectionnez Ajouter une balise et affectez des balises à ce cluster.
    9. Sélectionnez Create (Créer).
    Remarque

    La création de clusters prend quelques minutes. Une fois que le cluster est dans un état actif, vous pouvez le sélectionner pour héberger un modèle, lorsque vous créez une adresse pour ce modèle.
  • Utilisez la commande dedicated-AI-cluster create et les paramètres requis pour créer un cluster AI dédié :

    oci generative-ai dedicated-ai-cluster create 
    --compartment-id <compartment-OCID>
    --type HOSTING
    --unit-count [integer]
    --unit-shape [text]
    [OPTIONS]

    Pour obtenir la liste complète des paramètres et des valeurs des commandes de la CLI, reportez-vous à Référence des commandes de la CLI.

  • Exécutez l'opération CreateDedicatedAiCluster pour créer un cluster dédié.