Calcolo dei costi nell'AI generativa
Nell'AI generativa OCI, puoi pagare per l'inferenza on-demand o i cluster AI dedicati:
- Inferenza su richiesta
-
- Paghi mentre vai.
- Si paga per ogni lunghezza carattere della chiamata inferenza.
- Nella pagina Determinazione prezzi, quando viene visualizzato il prezzo per il numero di transazioni, si tratta del numero di caratteri nelle chiamate inferenza. Una transazione equivale a un solo carattere.
- Cluster AI dedicati
-
- Si ottiene un set dedicato di GPU.
- Puoi perfezionare i modelli personalizzati nei cluster AI dedicati.
- Puoi ospitare repliche di modelli di base e ottimizzati nei cluster AI dedicati.
- Si esegue il commit in anticipo su determinate ore di utilizzo dei cluster AI dedicati. Per i prezzi, consulta la pagina dei prezzi.
Rivedere gli argomenti e gli esempi riportati di seguito per facilitare la decisione tra l'inferenza su richiesta o l'utilizzo di cluster AI dedicati e per calcolare il costo per ciascuna opzione.