Pagamento per inferenze su richiesta
Con l'impegno nell'inferenza on-demand nell'AI generativa OCI puoi ottenere i seguenti vantaggi:
- Bassa barriera per iniziare a utilizzare l'intelligenza artificiale generativa.
- Accesso a tutti i modelli fondamentali di intelligenza artificiale generativa disponibili.
- Ottimo per sperimentare e valutare i modelli.
- Pay as you go per le transazioni. Per informazioni dettagliate, vedere la nota riportata di seguito.
Con l'inferenza on-demand si ottengono le lunghezze di carattere seguenti:
- Chat: lunghezza del prompt (in caratteri) + lunghezza della risposta (in caratteri)
- Incorporazioni testo: lunghezza di input (in caratteri)
Nella pagina Determinazione prezzi, 1 character
viene calcolato come 1 transaction
.
Se stai ospitando modelli di base o ottimizzandoli su cluster AI dedicati, ti viene addebitato l'ora dell'unità piuttosto che la transazione. In questo caso, consulta la sezione Pagamento per cluster AI dedicati per scoprire come calcolare i costi del cluster AI dedicato.
Confronto tra modelli e prezzi su richiesta
Nella pagina di determinazione prezzi è indicato il prezzo di 10.000 transazioni su richiesta quando si utilizza l'area di gioco, l'API o l'interfaccia CLI per l'inferenza.
Andare alla pagina Modelli pre-addestrati e selezionare il modello da utilizzare. Nella sezione Modalità su richiesta, trovare le informazioni sulla pagina Determinazione prezzi per il modello. Quindi, esaminare gli esempi in questa sezione per imparare a calcolare il costo in base al numero di caratteri di input e output.
Esempio di chat
Paul chiama il modello meta.llama-3.3-70b-instruct
con il seguente prompt, che è lungo 220 characters
:
Generare un passo del prodotto per un microfono compatto collegato tramite USB in grado di registrare il suono surround. Il microfono è più utile per registrare musica o conversazioni. Il microfono può essere utile anche per la registrazione di podcast.
La risposta del modello è lunga 2,205 characters
. Paul vuole sapere il costo di questa chiamata. Ecco i passaggi per calcolare il costo.
Oltre a calcolare il prezzo, è possibile stimare il costo selezionando la categoria AI e Machine Learning e caricando il valutatore dei costi per l'AI generativa OCI.
Esempio di incorporazione del testo
Gina sta convertendo i contratti dei clienti in embeddings per una nuova applicazione di ricerca semantica. In media, Gina ingerisce 16 documenti ogni ora. Ogni documento ha una lunghezza di circa 1,000 characters
. Gina vuole ottenere una stima della fattura mensile per la generazione di tali embeddings. Ecco i passaggi per calcolare il costo.