Pagamento per inferenze su richiesta
Con l'impegno nell'inferenza on-demand nell'AI generativa OCI puoi ottenere i seguenti vantaggi:
- Bassa barriera per iniziare a utilizzare l'intelligenza artificiale generativa.
- Accesso a tutti i modelli fondamentali di intelligenza artificiale generativa disponibili.
- Ottimo per sperimentare e valutare i modelli.
- Pay as you go per le transazioni. Per informazioni dettagliate, vedere la nota riportata di seguito.
Con l'inferenza on-demand si ottengono le lunghezze di carattere seguenti:
- Chat: lunghezza del prompt (in caratteri) + lunghezza della risposta (in caratteri)
- Incorporazioni testo: lunghezza di input (in caratteri)
Nella pagina Determinazione prezzi, 1 character viene calcolato come 1 transaction.
Se stai ospitando modelli di base o ottimizzandoli su cluster AI dedicati, ti viene addebitato l'ora dell'unità piuttosto che la transazione. In questo caso, consulta la sezione Pagamento per cluster AI dedicati per scoprire come calcolare i costi del cluster AI dedicato.
Confronto tra modelli e prezzi su richiesta
La pagina di determinazione prezzi elenca il prezzo per 10.000 transazioni su richiesta o 1.000.000 di token quando si utilizza l'area di gioco, l'API o l'interfaccia CLI per l'inferenza.
Andare alla pagina Modelli pre-addestrati e selezionare il modello da utilizzare. Nella sezione Modalità su richiesta, trovare le informazioni sulla pagina Determinazione prezzi per il modello. Quindi, esaminare gli esempi in questa sezione per imparare a calcolare il costo in base al numero di caratteri di input e output.
Esempio di chat
Paul chiama il modello meta.llama-3.3-70b-instruct con il seguente prompt, che è lungo 220 characters:
Generare un passo del prodotto per un microfono compatto collegato tramite USB in grado di registrare il suono surround. Il microfono è più utile per registrare musica o conversazioni. Il microfono può essere utile anche per la registrazione di podcast.
La risposta del modello è lunga 2,205 characters. Paul vuole sapere il costo di questa chiamata. Ecco i passaggi per calcolare il costo.
Oltre a calcolare il prezzo, è possibile stimare il costo selezionando la categoria AI e Machine Learning e caricando il valutatore dei costi per l'AI generativa OCI.
Esempio di incorporazione del testo
Gina sta convertendo i contratti dei clienti in embeddings per una nuova applicazione di ricerca semantica. In media, Gina ingerisce 16 documenti ogni ora. Ogni documento ha una lunghezza di circa 1,000 characters. Gina vuole ottenere una stima della fattura mensile per la generazione di tali embeddings. Ecco i passaggi per calcolare il costo.