Création d'un cluster d'IA dédié pour l'hébergement de modèle
Créez une ressource de cluster d'IA dédiée dans OCI Generative AI pour héberger des adresses pour des modèles de base préentraînés et des modèles personnalisés.
Important
- Non disponible à la demande : tous les modèles préentraînés de base d'OCI Generative AI pris en charge pour le mode de service à la demande qui utilisent les API de génération de texte et de synthèse (y compris le playground de test) sont désormais retirés. Nous vous recommandons plutôt d'utiliser les modèles de chat.
- Peut être hébergé sur des clusters : si vous hébergez un récapitulatif ou un modèle de génération tel que
cohere.command
sur un cluster d'IA dédié (mode de service dédié), vous pouvez continuer à utiliser ce modèle jusqu'à son abandon. Ces modèles, lorsqu'ils sont hébergés sur un cluster d'IA dédié, sont uniquement disponibles dans le Midwest des Etats-Unis (Chicago). Reportez-vous à la section Mise hors service des modèles pour connaître les dates et définitions de sortie.
- Remarque
La création de clusters prend quelques minutes. Une fois que le cluster est dans un état actif, vous pouvez le sélectionner pour héberger un modèle, lorsque vous créez une adresse pour ce modèle. Utilisez la commande dedicated-AI-cluster create et les paramètres requis pour créer un cluster AI dédié :
oci generative-ai dedicated-ai-cluster create --compartment-id <compartment-OCID> --type HOSTING --unit-count [integer] --unit-shape [text] [OPTIONS]
Pour obtenir la liste complète des paramètres et des valeurs des commandes de la CLI, reportez-vous à Référence des commandes de la CLI.
Exécutez l'opération CreateDedicatedAiCluster pour créer un cluster dédié.