Creazione di un cluster AI dedicato per i modelli di hosting
Crea una risorsa cluster AI dedicata nell'AI generativa OCI per ospitare gli endpoint per modelli di base e modelli personalizzati pre-addestrati.
Importante
- Non disponibile on-demand: tutti i modelli pre-addestrati di base dell'AI generativa OCI supportati per la modalità di servizio su richiesta che utilizzano le API di generazione testo e riepilogo (incluso il parco giochi) sono ora ritirati. Si consiglia di utilizzare i modelli di chat.
- Possono essere ospitati nei cluster: se si ospita un modello di generazione di riepilogo o un modello di generazione come
cohere.command
in un cluster AI dedicato (modalità di servizio dedicata), è possibile continuare a utilizzare tale modello fino a quando non viene ritirato. Questi modelli, se ospitati su un cluster AI dedicato, sono disponibili solo nel Midwest degli Stati Uniti (Chicago). Vedere Ritiro dei modelli per le date e le definizioni di smobilizzo.
- Nota
La creazione dei cluster richiede alcuni minuti. Quando il cluster si trova in uno stato attivo, è possibile selezionare tale cluster per ospitare un modello quando si crea un endpoint per tale modello. Usare il comando dedicated-AI-cluster create e i parametri richiesti per creare un cluster AI dedicato:
oci generative-ai dedicated-ai-cluster create --compartment-id <compartment-OCID> --type HOSTING --unit-count [integer] --unit-shape [text] [OPTIONS]
Per un elenco completo dei parametri e dei valori per i comandi CLI, consultare il manuale CLI Command Reference.
Eseguire l'operazione CreateDedicatedAiCluster per creare un cluster dedicato.