Calcolo dei costi nell'AI generativa

Nell'AI generativa OCI, puoi pagare per l'inferenza on-demand o i cluster AI dedicati:

Inferenza su richiesta
  • Paghi mentre vai.
  • Si paga per ogni lunghezza carattere della chiamata inferenza.
  • Nella pagina Determinazione prezzi, quando viene visualizzato il prezzo per il numero di transazioni, si tratta del numero di caratteri nelle chiamate inferenza. Una transazione equivale a un solo carattere.
Cluster AI dedicati
  • Si ottiene un set dedicato di GPU.
  • Puoi perfezionare i modelli personalizzati nei cluster AI dedicati.
  • Puoi ospitare repliche di modelli di base e ottimizzati nei cluster AI dedicati.
  • Si esegue il commit in anticipo su determinate ore di utilizzo dei cluster AI dedicati. Per i prezzi, consulta la pagina dei prezzi.

Rivedere gli argomenti e gli esempi riportati di seguito per facilitare la decisione tra l'inferenza su richiesta o l'utilizzo di cluster AI dedicati e per calcolare il costo per ciascuna opzione.