Creazione di un cluster AI dedicato per i modelli di hosting
Crea una risorsa cluster AI dedicata in OCI Generative AI per ospitare endpoint per modelli di base pre-addestrati, modelli personalizzati o modelli importati.
Importante
- Non disponibile on-demand: tutti i modelli pre-addestrati di base dell'AI generativa OCI supportati per la modalità di servizio su richiesta che utilizzano le API di generazione testo e riepilogo (incluso il parco giochi) sono ora ritirati. Si consiglia di utilizzare i modelli di chat.
- Possono essere ospitati nei cluster: se si ospita un modello di generazione di riepilogo o un modello di generazione come
cohere.commandin un cluster AI dedicato (modalità di servizio dedicata), è possibile continuare a utilizzare tale modello fino a quando non viene ritirato. Questi modelli, se ospitati su un cluster AI dedicato, sono disponibili solo nel Midwest degli Stati Uniti (Chicago). Vedere API non più valide nell'intelligenza artificiale generativa per la data in cui le API non sono più disponibili.
- Nota
La creazione dei cluster richiede alcuni minuti. Quando il cluster si trova in uno stato attivo, è possibile selezionare tale cluster per ospitare un modello quando si crea un endpoint per tale modello. Usare il comando dedicated-AI-cluster create e i parametri richiesti per creare un cluster AI dedicato:
oci generative-ai dedicated-ai-cluster create --compartment-id <compartment-OCID> --type HOSTING --unit-count [integer] --unit-shape [text] [OPTIONS]Per un elenco completo dei parametri e dei valori per i comandi CLI, consultare il manuale CLI Command Reference.
Eseguire l'operazione CreateDedicatedAiCluster per creare un cluster dedicato.