Calcolo del costo nell'AI generativa

In OCI Generative AI puoi pagare per l'inferenza on-demand o i cluster AI dedicati:

Inferenza su richiesta
  • Paghi mentre vai.
  • Si paga per la lunghezza del carattere di ogni chiamata di inferenza.
  • Nella pagina Determinazione prezzi, quando viene visualizzato il prezzo per il numero di transazioni, corrisponde al numero di caratteri nelle chiamate inferenza. Una transazione è uguale a un carattere.
Cluster AI dedicati
  • Ottieni un set dedicato di GPU.
  • È possibile ottimizzare i modelli personalizzati nei cluster AI dedicati.
  • È possibile ospitare repliche di modelli di base e ottimizzati nei cluster AI dedicati.
  • Si esegue il commit in anticipo di determinate ore di utilizzo dei cluster AI dedicati. Per i prezzi, vedere la pagina dei prezzi.

Rivedere gli argomenti e gli esempi riportati di seguito per facilitare la scelta tra inferenze on-demand o l'utilizzo di cluster AI dedicati e per calcolare il costo per ciascuna opzione.