Paiement pour référencement sur demande
Les avantages suivants s'appliquent à l'inférence sur demande dans l'intelligence artificielle générative OCI :
- Faible barrière pour commencer à utiliser l'IA générative.
- Accès à tous les modèles fondamentaux du service d'intelligence artificielle générative disponibles.
- Idéal pour expérimenter et évaluer les modèles.
- Pay as you go pour les transactions. Pour plus de détails, voir la note suivante.
Avec l'inférence sur demande, vous payez selon vos besoins pour les longueur de caractère suivantes :
- Clavardage : longueur d'invite (en caractères) + longueur de réponse (en caractères)
- Intégrations de texte : Longueur d'entrée (en caractères)
Dans la page de tarification, 1 character
est calculé comme suit : 1 transaction
.
Si vous hébergez des modèles fondamentaux ou que vous les réglez avec précision sur des grappes d'IA dédiées, vous êtes facturé en heure d'unité plutôt qu'en transaction. Dans ce cas, voir Paiement des grappes dédiées à l'IA pour savoir comment calculer les coûts des grappes dédiées à l'IA .
Rapprochement des modèles aux prix sur demande
Consultez les tableaux suivants pour faire correspondre un modèle de base à son nom de produit dans la page de tarification. La page de tarification répertorie le prix de 10 000 transactions sur demande lors de l'utilisation du terrain de jeu, de l'API ou de l'interface de ligne de commande pour l'inférence.
Modèles de clavardage
Nom de modèle | Nom du modèle OCI | Nom du produit de la page de tarification |
---|---|---|
Cohere Command A | cohere.command-a-03-2025 |
Large Cohere |
Cohere Command R 08-2024 | cohere.command-r-08-2024 |
Small Cohere |
Cohere Command R+ 08-2024 | cohere.command-r-plus-08-2024 |
Large Cohere |
Cohere Command R | cohere.command-r-16k (obsolète) |
Small Cohere |
Cohere Command R+ | cohere.command-r-plus (obsolète) |
Large Cohere |
Meta Llama 4 Maverick | meta.llama-4-maverick-17b-128e-instruct-fp8 |
Meta Llama 4 Maverick |
Meta Llama 4 Scout | meta.llama-4-scout-17b-16e-instruct |
Meta Llama 4 Scout |
Meta Llama 3.3 | meta.llama-3.3-70b-instruct |
Large Meta |
Meta Llama 3.2 11B Vision | meta.llama-3.2-11b-vision-instruct |
Large Meta |
Meta Llama 3.2 90B Vision | meta.llama-3.2-90b-vision-instruct |
Large Meta |
Meta Llama 3.1 (70B) | meta.llama-3.1-70b-instruct |
Large Meta |
Meta Llama 3.1 (405B) | meta.llama-3.1-405b-instruct |
Meta Llama 3.1 405B |
Meta Llama 3 | meta.llama-3-70b-instruct (obsolète) |
Large Meta |
Les modèles de récapitulation et de génération de texte pris en charge pour le mode sur demande sont maintenant abandonnés. Nous vous recommandons d'utiliser les modèles de chat à la place.
Intégration de modèles
Nom de modèle | Nom du modèle OCI | Nom du produit de la page de tarification |
---|---|---|
Cohere Embed Anglais Image V3 | cohere.embed-english-image-v3.0 |
Embed Cohere |
Cohere Embed Multilingual Image V3 | cohere.embed-multilingual-image-v3.0 |
Embed Cohere |
Cohere Embed English Light Image V3 | cohere.embed-english-light-image-v3.0 |
Embed Cohere |
Cohere Embed Multilingual Light Image V3 | cohere.embed-multilingual-light-image-v3.0 |
Embed Cohere |
Cohere Embed English V3 | cohere.embed-english-v3.0 |
Embed Cohere |
Cohere Embed Multilingual V3 | cohere.embed-multilingual-v3.0 |
Embed Cohere |
Cohere Embed English Light V3 | cohere.embed-english-light-v3.0 |
Embed Cohere |
Cohere Embed Multilingual Light V3 | cohere.embed-multilingual-light-v3.0 |
Embed Cohere |
Exemple de clavardage
Paul appelle le modèle meta.llama-3.3-70b-instruct
avec l'invite suivante, qui est longue de 220 characters
:
Générez une hauteur de produit pour un microphone compact connecté USB qui peut enregistrer le son surround. Le microphone est le plus utile pour enregistrer de la musique ou des conversations. Le microphone peut également être utile pour enregistrer des podcasts.
La réponse du modèle est longue de 2,205 characters
. Paul veut connaître le coût de cet appel. Voici les étapes à suivre pour calculer le coût.
En plus de calculer le prix, vous pouvez estimer le coût en sélectionnant la catégorie IA et apprentissage automatique et en chargeant l'estimateur de coûts pour l'IA générative OCI.
Exemple d'intégration de texte
Gina convertit les contrats clients en intégrations pour une nouvelle application de recherche sémantique. En moyenne, Gina ingère 16 documents toutes les heures. Chaque document a une longueur d'environ 1,000 characters
. Gina veut obtenir une estimation de la facture mensuelle pour générer ces intégrations. Voici les étapes à suivre pour calculer le coût.