Calcolo del costo nell'AI generativa

In OCI Generative AI puoi pagare per l'inferenza on-demand o i cluster AI dedicati:

Inferenza su richiesta

Paghi mentre vai.
Si paga per la lunghezza del carattere di ogni chiamata di inferenza.
Nella pagina Determinazione prezzi, quando viene visualizzato il prezzo per il numero di transazioni, corrisponde al numero di caratteri nelle chiamate inferenza. Una transazione è uguale a un carattere.

Cluster AI dedicati

Ottieni un set dedicato di GPU.
È possibile ottimizzare i modelli personalizzati nei cluster AI dedicati.
È possibile ospitare repliche di modelli di base e ottimizzati nei cluster AI dedicati.
Si esegue il commit in anticipo di determinate ore di utilizzo dei cluster AI dedicati. Per i prezzi, vedere la pagina dei prezzi.

Rivedere gli argomenti e gli esempi riportati di seguito per facilitare la scelta tra inferenze on-demand o l'utilizzo di cluster AI dedicati e per calcolare il costo per ciascuna opzione.

Pagamento per inferenza su richiesta
Pagare per cluster AI dedicati

Documentazione dell'infrastruttura Oracle Cloud

Calcolo del costo nell'AI generativa