Paiement pour référencement sur demande
Les avantages suivants s'appliquent à l'inférence sur demande dans l'intelligence artificielle générative OCI :
- Faible barrière pour commencer à utiliser l'IA générative.
- Accès à tous les modèles fondamentaux du service d'intelligence artificielle générative disponibles.
- Idéal pour expérimenter et évaluer les modèles.
- Pay as you go pour les transactions. Pour plus de détails, voir la note suivante.
Avec l'inférence sur demande, vous payez selon vos besoins pour les longueur de caractère suivantes :
- Clavardage : longueur d'invite (en caractères) + longueur de réponse (en caractères)
- Intégrations de texte : Longueur d'entrée (en caractères)
Dans la page de tarification, 1 character
est calculé comme suit : 1 transaction
.
Si vous hébergez des modèles fondamentaux ou que vous les réglez avec précision sur des grappes d'IA dédiées, vous êtes facturé en heure d'unité plutôt qu'en transaction. Dans ce cas, voir Paiement des grappes dédiées à l'IA pour savoir comment calculer les coûts des grappes dédiées à l'IA .
Rapprochement des modèles aux prix sur demande
La page de tarification répertorie le prix de 10 000 transactions sur demande lors de l'utilisation du terrain de jeu, de l'API ou de l'interface de ligne de commande pour l'inférence.
Allez à la page Modèles préentraînés et sélectionnez le modèle avec lequel vous voulez travailler. Dans la section Mode sur demande, recherchez les informations sur la page de tarification pour le modèle. Ensuite, consultez les exemples de cette section pour apprendre à calculer le coût en fonction du nombre de caractères d'entrée et de sortie.
Exemple de clavardage
Paul appelle le modèle meta.llama-3.3-70b-instruct
avec l'invite suivante, qui est longue de 220 characters
:
Générez une hauteur de produit pour un microphone compact connecté USB qui peut enregistrer le son surround. Le microphone est le plus utile pour enregistrer de la musique ou des conversations. Le microphone peut également être utile pour enregistrer des podcasts.
La réponse du modèle est longue de 2,205 characters
. Paul veut connaître le coût de cet appel. Voici les étapes à suivre pour calculer le coût.
En plus de calculer le prix, vous pouvez estimer le coût en sélectionnant la catégorie IA et apprentissage automatique et en chargeant l'estimateur de coûts pour l'IA générative OCI.
Exemple d'intégration de texte
Gina convertit les contrats clients en intégrations pour une nouvelle application de recherche sémantique. En moyenne, Gina ingère 16 documents toutes les heures. Chaque document a une longueur d'environ 1,000 characters
. Gina veut obtenir une estimation de la facture mensuelle pour générer ces intégrations. Voici les étapes à suivre pour calculer le coût.