Création d'une grappe dédiée à l'IA pour héberger des modèles

Créez une ressource de grappe d'IA dédiée dans l'IA générative OCI pour héberger des points d'extrémité pour les modèles de base préentraînés et les modèles personnalisés.

Important

  • Non disponible sur demande : Tous les modèles préentraînés de base du service d'intelligence artificielle générative pour OCI pris en charge pour le mode de service sur demande qui utilisent les API de génération de texte et de récapitulation (y compris le terrain de jeu) sont maintenant mis hors service. Nous vous recommandons d'utiliser les modèles de chat à la place.
  • Peut être hébergé sur des grappes : Si vous hébergez une récapitulation ou un modèle de génération tel que cohere.command sur une grappe dédiée à l'IA (mode de service dédié), vous pouvez continuer à utiliser ce modèle jusqu'à ce qu'il soit abandonné. Ces modèles, lorsqu'ils sont hébergés sur une grappe dédiée à l'IA, sont disponibles uniquement dans le Midwest des États-Unis (Chicago). Voir Mise hors service des modèles pour les dates et les définitions de mise hors service.
    1. Dans la page de liste Grappes dédiées à l'IA, sélectionnez Créer une grappe dédiée à l'IA. Si vous avez besoin d'aide pour trouver la page de liste, voir Liste des grappes dédiées à l'IA.
    2. Sélectionnez un compartiment dans lequel créer la grappe dédiée à l'IA. Le compartiment par défaut est le même que la page de liste, mais vous pouvez sélectionner tout compartiment que vous êtes autorisé à utiliser.
    3. (Facultatif) Entrez un nom et une description pour la grappe. Si vous n'entrez pas de nom, le système en génère un que vous pourrez modifier plus tard.

      Le nom généré a le format generativeaidedicatedaicluster<timestamp>. Par exemple : generativeaidedicatedaicluster20250922181431

    4. Pour Type de grappe, sélectionnez Hébergement.
    5. Pour Modèle de base, sélectionnez le modèle de base de base pour les modèles que vous voulez héberger sur cette grappe. La liste des modèles inclut uniquement les modèles de base qui ne sont pas encore mis hors service pour le mode sur demande.
      Pour la taille de l'unité de grappe dédiée et les règles relatives aux points d'extrémité des modèles hébergés dans la grappe, sélectionnez le modèle de base répertorié dans la page Modèles fondamentaux préentraînés dans l'intelligence artificielle générative.
    6. (Facultatif) Augmentez le nombre d'instances dans le champ Réplique de modèle.
      Important

      Lorsque vous créez une grappe pour l'hébergement de modèles à des fins d'inférence, une unité est créée par défaut pour le modèle de base que vous sélectionnez. Pour augmenter le débit, vous pouvez augmenter le nombre d'instances dans le champ Réplique de modèle maintenant ou ultérieurement lorsque vous modifiez la grappe. Par exemple, la création de deux répliques de modèle sur ce cluster nécessite deux unités.
    7. Lisez les heures de l'unité d'engagement pour la grappe d'hébergement et cochez la case pour accepter l'engagement.
    8. (Facultatif) Sélectionnez Ajouter un marqueur et affectez des marqueurs à cette grappe.
    9. Sélectionnez Créer.
    Note

    La création de grappes prend quelques minutes. Une fois que la grappe est active, vous pouvez la sélectionner pour héberger un modèle, lorsque vous créez un point d'extrémité pour ce modèle.
  • Utilisez la commande dedicated-AI-cluster create et les paramètres requis pour créer une grappe dédiée à l'IA :

    oci generative-ai dedicated-ai-cluster create 
    --compartment-id <compartment-OCID>
    --type HOSTING
    --unit-count [integer]
    --unit-shape [text]
    [OPTIONS]

    Pour la liste complète des paramètres et des valeurs pour les commandes de l'interface de ligne de commande, voir Informations de référence sur les commandes de l'interface de ligne de commande.

  • Exécutez l'opération CreateDedicatedAiCluster pour créer une grappe dédiée.