Calcolo del costo nell'AI generativa
In OCI Generative AI puoi pagare per l'inferenza on-demand o i cluster AI dedicati:
- Inferenza su richiesta
-
- Paghi mentre vai.
- Si paga per la lunghezza del carattere di ogni chiamata di inferenza.
- Nella pagina Determinazione prezzi, quando viene visualizzato il prezzo per il numero di transazioni, corrisponde al numero di caratteri nelle chiamate inferenza. Una transazione è uguale a un carattere.
- Cluster AI dedicati
-
- Ottieni un set dedicato di GPU.
- È possibile ottimizzare i modelli personalizzati nei cluster AI dedicati.
- È possibile ospitare repliche di modelli di base e ottimizzati nei cluster AI dedicati.
- Si esegue il commit in anticipo di determinate ore di utilizzo dei cluster AI dedicati. Per i prezzi, vedere la pagina dei prezzi.
Rivedere gli argomenti e gli esempi riportati di seguito per facilitare la scelta tra inferenze on-demand o l'utilizzo di cluster AI dedicati e per calcolare il costo per ciascuna opzione.