Pagare per cluster AI dedicati

I cluster AI dedicati in OCI Generative AI forniscono prezzi prevedibili e capacità dedicata per l'ottimizzazione e l'hosting dei modelli.

Per i modelli pre-addestrati di OCI Generative AI, si applicano i seguenti impegni minimi:

Cluster di hosting: impegno minimo di 744 ore-unità per cluster di hosting.
Cluster di ottimizzazione: impegno minimo di 1 unità di ora per ogni job di ottimizzazione. Alcuni modelli richiedono almeno 2 unità per l'ottimizzazione.

Nota

I modelli importati non richiedono l'impegno di hosting di 744 ore per unità. Se crei un cluster AI dedicato per ospitare un modello importato, puoi ospitare il modello senza impegnarti all'impegno di hosting minimo che si applica AI modelli pre-addestrati e ottimizzati di OCI Generative AI.

Gli esempi seguenti mostrano come calcolare i costi del cluster AI dedicati in OCI Generative AI. Per i costi di inferenza su richiesta, vedere Pagamento di inferenze su richiesta.

Modelli corrispondenti a prezzi unità cluster dedicata

Se stai ospitando i modelli di base o li stai fine-tuning su cluster AI dedicati, ti viene addebitato l'ora dell'unità piuttosto che la transazione.

Andare alla pagina Modelli pre-addestrati e selezionare il modello da utilizzare. Nella sezione Cluster AI dedicato per il modello, individuare la dimensione dell'unità per il cluster AI dedicato corrispondente al modello e alle informazioni sulla pagina di determinazione prezzi. Quindi, esaminare gli esempi in questa sezione per imparare a calcolare il costo per l'utilizzo di questi modelli.

Importante

Alcuni modelli di base pre-addestrati di base di AI generativa OCI supportati per la modalità di servizio dedicata sono ora non più validi e verranno ritirati non prima di 6 mesi dopo il rilascio del 1^o modello di sostituzione. È possibile ospitare un modello di base o ottimizzare un modello di base e ospitare il modello ottimizzato in un cluster AI dedicato (modalità di servizio dedicata) fino a quando il modello di base non viene ritirato. Per le date di ritiro della modalità di servizio dedicata, vedere Ritiro dei modelli.

Hosting di un modello di base Esempio 1

John desidera ospitare un'istanza del modello Command R+ 08-2024 (cohere.command-r-plus-08-2024) sull'infrastruttura dedicata. John elimina il cluster dopo 40 giorni e desidera conoscere il costo del cluster. Per ospitare un modello cohere.command-r-plus-08-2024, John deve prima identificare la dimensione dell'unità che può ospitare il modello cohere.command-r-plus-08-2024. La dimensione dell'unità per il modello cohere.command-r-plus-08-2024 è un'unità Large Cohere V2_2. Vedere Cluster AI dedicato per il modello.

John ha bisogno di almeno un'unità Large Cohere V2_2 per ospitare il modello cohere.command-r-plus-08-2024. Ecco i passaggi per calcolare il costo di un cluster di hosting con un'unità Large Cohere V2_2.

Calcolare le ore unità per 40 giorni.

40 days x 24 hours per day x 1 unit = 960 unit hours.

Assicurarsi che le ore di unità superino l'impegno minimo per l'hosting dei modelli.
```
960 unit hours > 744 minimum unit hours
```
Vai a Prezzi AI e all'interno di OCI Generative AI, per Oracle Cloud Infrastructure Generative AI- Large Cohere - Dedicated, trova il sito <Large-Cohere-dedicated-unit-per-hour-price>.
Nella sezione dedicata del cluster AI della sezione Cluster AI dedicato per il modello, trovare il moltiplicatore per il modello cohere.command-r-plus-08-2024:
```
                                For Hosting, Multiply the Unit Price: x 2
```

Calcolare il prezzo per 40 giorni.

price = (960 unit hours) x $<Large-Cohere-dedicated-unit-per-hour-price> x 2

Hosting di un modello di base Esempio 2

Alice vuole ospitare un'istanza del modello Command R 08-2024 (cohere.command-r-08-2024) su un'infrastruttura dedicata. Per ospitare un modello cohere.command-r-08-2024, Alice deve prima identificare la dimensione dell'unità che può ospitare il modello Command R 08-2024. La dimensione unità per Command R 08-2024 è un'unità Small Cohere V2. Vedere Cluster AI dedicato per il modello.

Alice decide di acquistare tre unità di Small Cohere V2 per gestire un volume di chiamate superiore al modello di quello che una singola unità fornirebbe. Alice prevede di eliminare il cluster dopo cinque giorni. Ecco i passaggi per calcolare il costo di un cluster di hosting con tre unità Small Cohere V2 per cinque giorni.

Calcolare le ore unità.

5 days x 24 hours per day x 3 units = 360 unit hours.

Confronta le ore di unità con l'impegno minimo per ospitare i modelli.

360 unit hours < 744 minimum unit hours
Alice is charged for 744 unit hours.

Vai AI prezzi dell'AI e all'interno di OCI Generative AI, per Oracle Cloud Infrastructure Generative AI- Small Cohere - Dedicated, trova <Small-Cohere-dedicated-unit-per-hour-price>.
Nella sezione Cluster AI dedicato per il modello, individuare il moltiplicatore per il modello cohere.command-r-08-2024.

Non è necessario moltiplicare il prezzo per il modello di hosting cohere.command-r-08-2024.

Calcolare il costo per cinque giorni.

price = (744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>

Ottimizzazione e hosting di un esempio di modello

Bob vuole perfezionare un modello Command R 08-2024 (cohere.command-r-08-2024). Bob crea un cluster AI fine-tuning dedicato con il valore preimpostato di otto unità Small Cohere V2. Bob crea un modello personalizzato nel cluster AI fine-tuning dedicato e ottimizza il modello di base Command R 08-2024 con i dati di addestramento. Il completamento del processo di ottimizzazione richiede 5 ore. Bob crea un cluster di messa a punto ogni settimana.

Per ospitare un modello cohere.command-r-08-2024, Bob deve identificare la dimensione dell'unità che può ospitare il modello cohere.command-r-08-2024. La dimensione dell'unità per il modello cohere.command-r-08-2024 è un'unità Small Cohere V2. Vedere Cluster AI dedicato per il modello. Bob può ospitare fino a 50 modelli ottimizzati su un singolo cluster di hosting. Ecco i passaggi per calcolare il costo mensile per la messa a punto e l'hosting dei modelli.

Calcolare le ore di unità per ogni messa a punto.

Each fine-tuning cluster requires 8 units and each cluster is active for 5 hours
fine-tuning per cluster = 40 unit-hours

Confrontare le ore di unità con l'impegno minimo per la messa a punto dei modelli.
```
40 unit hours > 1 unit hour
```

Calcolare le ore di unità per l'hosting.

31 days x 24 hours per day x 1 unit = 744 unit hours

Confronta le ore di unità con l'impegno minimo per ospitare i modelli.
```
744 unit hours = 744 minimum unit hours
```
Vai AI prezzi dell'AI e all'interno di OCI Generative AI, per Oracle Cloud Infrastructure Generative AI- Small Cohere - Dedicated, trova <Small-Cohere-dedicated-unit-per-hour-price>.

Trova il prezzo mensile totale.

fine-tuning price = (40 unit hours) per week x (4 weeks) x $<Small-Cohere-dedicated-unit-per-hour-price> 
                            
fine-tuning price = 160 x <Small-Cohere-dedicated-unit-per-hour-price>

hosting price = (744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>

total monthly price = (160 + 744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>

Suggerimento

Oltre a calcolare il prezzo, è possibile stimare il costo selezionando la categoria AI e Machine Learning e caricando la stima dei costi per OCI Generative AI.

Documentazione dell'infrastruttura Oracle Cloud

Pagare per cluster AI dedicati

Modelli corrispondenti a prezzi unità cluster dedicata

Hosting di un modello di base Esempio 1

Hosting di un modello di base Esempio 2

Ottimizzazione e hosting di un esempio di modello