Création d'un cluster d'IA dédié pour l'hébergement de modèle
Créez une ressource de cluster d'IA dédiée dans OCI Generative AI pour héberger les adresses pour les modèles de base préentraînés, les modèles personnalisés ou les modèles importés.
Important
- Non disponible à la demande : tous les modèles préentraînés de base d'OCI Generative AI pris en charge pour le mode de service à la demande qui utilisent les API de génération de texte et de synthèse (y compris le playground de test) sont désormais retirés. Nous vous recommandons plutôt d'utiliser les modèles de chat.
- Peut être hébergé sur des clusters : si vous hébergez un récapitulatif ou un modèle de génération tel que
cohere.commandsur un cluster d'IA dédié (mode de service dédié), vous pouvez continuer à utiliser ce modèle jusqu'à son abandon. Ces modèles, lorsqu'ils sont hébergés sur un cluster d'IA dédié, sont uniquement disponibles dans le Midwest des Etats-Unis (Chicago). Reportez-vous à API en phase d'abandon dans Generative AI pour connaître la date à laquelle les API ne sont plus disponibles.
- Remarque
La création de clusters prend quelques minutes. Une fois que le cluster est dans un état actif, vous pouvez le sélectionner pour héberger un modèle, lorsque vous créez une adresse pour ce modèle. Utilisez la commande dedicated-AI-cluster create et les paramètres requis pour créer un cluster AI dédié :
oci generative-ai dedicated-ai-cluster create --compartment-id <compartment-OCID> --type HOSTING --unit-count [integer] --unit-shape [text] [OPTIONS]Pour obtenir la liste complète des paramètres et des valeurs des commandes de la CLI, reportez-vous à Référence des commandes de la CLI.
Exécutez l'opération CreateDedicatedAiCluster pour créer un cluster dédié.