Création d'une grappe dédiée à l'IA pour héberger des modèles
Créez une ressource de grappe d'IA dédiée dans l'IA générative OCI pour héberger des points d'extrémité pour les modèles de base préentraînés et les modèles personnalisés.
Important
- Non disponible sur demande : Tous les modèles préentraînés de base du service d'intelligence artificielle générative pour OCI pris en charge pour le mode de service sur demande qui utilisent les API de génération de texte et de récapitulation (y compris le terrain de jeu) sont maintenant mis hors service. Nous vous recommandons d'utiliser les modèles de chat à la place.
- Peut être hébergé sur des grappes : Si vous hébergez une récapitulation ou un modèle de génération tel que
cohere.command
sur une grappe dédiée à l'IA (mode de service dédié), vous pouvez continuer à utiliser ce modèle jusqu'à ce qu'il soit abandonné. Ces modèles, lorsqu'ils sont hébergés sur une grappe dédiée à l'IA, sont disponibles uniquement dans le Midwest des États-Unis (Chicago). Voir Mise hors service des modèles pour les dates et les définitions de mise hors service.
- Note
La création de grappes prend quelques minutes. Une fois que la grappe est active, vous pouvez la sélectionner pour héberger un modèle, lorsque vous créez un point d'extrémité pour ce modèle. Utilisez la commande dedicated-AI-cluster create et les paramètres requis pour créer une grappe dédiée à l'IA :
oci generative-ai dedicated-ai-cluster create --compartment-id <compartment-OCID> --type HOSTING --unit-count [integer] --unit-shape [text] [OPTIONS]
Pour la liste complète des paramètres et des valeurs pour les commandes de l'interface de ligne de commande, voir Informations de référence sur les commandes de l'interface de ligne de commande.
Exécutez l'opération CreateDedicatedAiCluster pour créer une grappe dédiée.