Pagamento per inferenza su richiesta
Ottieni i seguenti vantaggi adottando l'inferenza on-demand nell'AI generativa OCI:
- Barriera bassa per iniziare a utilizzare l'intelligenza artificiale generativa.
- Accesso a tutti i modelli fondamentali di intelligenza artificiale generativa disponibili.
- Ottimo per sperimentare e valutare i modelli.
- Pay as you go per le transazioni. Per i dettagli, vedere la nota seguente.
Con l'inferenza on-demand si paga man mano che si utilizzano le seguenti lunghezze di caratteri:
- Chat: lunghezza richiesta (in caratteri) + lunghezza risposta (in caratteri)
- Incorporazioni testo: lunghezza di input (in caratteri)
Nella pagina Determinazione prezzi, 1 character viene calcolato come 1 transaction.
Se stai ospitando modelli di base o ottimizzandoli su cluster AI dedicati, ti viene addebitato l'ora dell'unità piuttosto che la transazione. In questo caso, consulta la sezione Pagamento per cluster AI dedicati per scoprire come calcolare i costi del cluster AI dedicato.
Modelli corrispondenti ai prezzi su richiesta
La pagina di determinazione prezzi elenca il prezzo per 10.000 transazioni su richiesta o 1.000.000 di token quando si utilizza l'area di gioco, l'API o l'interfaccia CLI per l'inferenza.
Andare alla pagina Modelli pre-addestrati e selezionare il modello da utilizzare. Nella sezione Modalità su richiesta, trovare le informazioni sulla pagina Determinazione prezzi per il modello. Quindi, esaminare gli esempi in questa sezione per imparare a calcolare il costo in base al numero di caratteri di input e output.
Esempio di chat
Paul chiama il modello meta.llama-3.3-70b-instruct con il prompt seguente, che è lungo 220 characters:
Genera un pitch del prodotto per un microfono compatto connesso tramite USB in grado di registrare il suono surround. Il microfono è più utile nella registrazione di musica o conversazioni. Il microfono può essere utile anche per registrare podcast.
La risposta del modello è lunga 2,205 characters. Paolo vuole sapere il costo di questa chiamata. Ecco i passaggi per calcolare il costo.
Oltre a calcolare il prezzo, è possibile stimare il costo selezionando la categoria AI e Machine Learning e caricando la stima dei costi per OCI Generative AI.
Esempio di incorporamenti testo
Gina sta convertendo i contratti dei clienti in integrazioni per una nuova applicazione di ricerca semantica. In media, Gina ingerisce 16 documenti ogni ora. Ogni documento è lungo circa 1,000 characters. Gina vuole ottenere una stima della fattura mensile per la generazione di tali integrazioni. Ecco i passaggi per calcolare il costo.