Paiement pour référencement sur demande

Les avantages suivants s'appliquent à l'inférence sur demande dans l'intelligence artificielle générative OCI :

  • Faible barrière pour commencer à utiliser l'IA générative.
  • Accès à tous les modèles fondamentaux du service d'intelligence artificielle générative disponibles.
  • Idéal pour expérimenter et évaluer les modèles.
  • Pay as you go pour les transactions. Pour plus de détails, voir la note suivante.
Note

Avec l'inférence sur demande, vous payez selon vos besoins pour les longueur de caractère suivantes :

  • Clavardage : longueur d'invite (en caractères) + longueur de réponse (en caractères)
  • Intégrations de texte : Longueur d'entrée (en caractères)

Dans la page de tarification, 1 character est calculé comme suit : 1 transaction.

Si vous hébergez des modèles fondamentaux ou que vous les réglez avec précision sur des grappes d'IA dédiées, vous êtes facturé en heure d'unité plutôt qu'en transaction. Dans ce cas, voir Paiement des grappes dédiées à l'IA pour savoir comment calculer les coûts des grappes dédiées à l'IA .

Rapprochement des modèles aux prix sur demande

Consultez les tableaux suivants pour faire correspondre un modèle de base à son nom de produit dans la page de tarification. La page de tarification répertorie le prix de 10 000 transactions sur demande lors de l'utilisation du terrain de jeu, de l'API ou de l'interface de ligne de commande pour l'inférence.

Modèles de clavardage

Nom de modèle Nom du modèle OCI Nom du produit de la page de tarification
Cohere Command A cohere.command-a-03-2025 Large Cohere
Cohere Command R 08-2024 cohere.command-r-08-2024 Small Cohere
Cohere Command R+ 08-2024 cohere.command-r-plus-08-2024 Large Cohere
Cohere Command R cohere.command-r-16k (obsolète) Small Cohere
Cohere Command R+ cohere.command-r-plus (obsolète) Large Cohere
Meta Llama 4 Maverick meta.llama-4-maverick-17b-128e-instruct-fp8 Meta Llama 4 Maverick
Meta Llama 4 Scout meta.llama-4-scout-17b-16e-instruct Meta Llama 4 Scout
Meta Llama 3.3 meta.llama-3.3-70b-instruct Large Meta
Meta Llama 3.2 11B Vision meta.llama-3.2-11b-vision-instruct Large Meta
Meta Llama 3.2 90B Vision meta.llama-3.2-90b-vision-instruct Large Meta
Meta Llama 3.1 (70B) meta.llama-3.1-70b-instruct Large Meta
Meta Llama 3.1 (405B) meta.llama-3.1-405b-instruct Meta Llama 3.1 405B
Meta Llama 3 meta.llama-3-70b-instruct (obsolète) Large Meta
Important

Les modèles de récapitulation et de génération de texte pris en charge pour le mode sur demande sont maintenant abandonnés. Nous vous recommandons d'utiliser les modèles de chat à la place.

Intégration de modèles

Nom de modèle Nom du modèle OCI Nom du produit de la page de tarification
Cohere Embed Anglais Image V3 cohere.embed-english-image-v3.0 Embed Cohere
Cohere Embed Multilingual Image V3 cohere.embed-multilingual-image-v3.0 Embed Cohere
Cohere Embed English Light Image V3 cohere.embed-english-light-image-v3.0 Embed Cohere
Cohere Embed Multilingual Light Image V3 cohere.embed-multilingual-light-image-v3.0 Embed Cohere
Cohere Embed English V3 cohere.embed-english-v3.0 Embed Cohere
Cohere Embed Multilingual V3 cohere.embed-multilingual-v3.0 Embed Cohere
Cohere Embed English Light V3 cohere.embed-english-light-v3.0 Embed Cohere
Cohere Embed Multilingual Light V3 cohere.embed-multilingual-light-v3.0 Embed Cohere

Exemple de clavardage

Paul appelle le modèle meta.llama-3.3-70b-instruct avec l'invite suivante, qui est longue de 220 characters :

Générez une hauteur de produit pour un microphone compact connecté USB qui peut enregistrer le son surround. Le microphone est le plus utile pour enregistrer de la musique ou des conversations. Le microphone peut également être utile pour enregistrer des podcasts.

La réponse du modèle est longue de 2,205 characters. Paul veut connaître le coût de cet appel. Voici les étapes à suivre pour calculer le coût.

  1. Calculez la invite + longueur de la réponse (en caractères).

    Ajoutons la longueur de l'invite (220 caractères) et la longueur de la réponse du modèle (2 205 caractères).

    prompt + response length = 220 + 2,205 = 2,425 characters
  2. Calculez le nombre de transactions.

    Les prix sont indiqués pour 10 000 transactions.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    2,425 characters = 2,425 transactions
  3. Allez à Tarification de l'intelligence artificielle et, sous IA générative OCI, pour Oracle Cloud Infrastructure Generative AI - Méta volumineux, recherchez <Large-Meta-unit-price>.
    Paul utilise le modèle meta.llama-3.3-70b-instruct qui correspond au produit, Generative AI OCI - Large Meta dans la page Tarifs de l'IA générative.
  4. Calculez le prix pour 1 838 caractères.
    price = (2,425 transactions )/ (10,000 transactions) x $<Large-Meta-unit-price>
Conseil

En plus de calculer le prix, vous pouvez estimer le coût en sélectionnant la catégorie IA et apprentissage automatique et en chargeant l'estimateur de coûts pour l'IA générative OCI.

Exemple d'intégration de texte

Gina convertit les contrats clients en intégrations pour une nouvelle application de recherche sémantique. En moyenne, Gina ingère 16 documents toutes les heures. Chaque document a une longueur d'environ 1,000 characters. Gina veut obtenir une estimation de la facture mensuelle pour générer ces intégrations. Voici les étapes à suivre pour calculer le coût.

  1. Calculez la longueur d'entrée (en caractères).

    Ajoutons la longueur du caractère d'entrée pour chaque heure.

    input character length for 16 documents = 16 x 1,000 = 16,000 characters per hour
  2. Allez à Tarification de l'intelligence artificielle et, sous IA générative OCI, pour Oracle Cloud Infrastructure Generative AI - Intégrer une cohère, recherchez <Embed-Cohere-unit-price>.
    Gina utilise le modèle cohere.embed qui correspond au produit, Oracle Cloud Infrastructure Generative AI - Embed Cohere dans la page Tarifs pour l'IA pour l'IA générative.
  3. Calculez le nombre de transactions par heure.

    Gina ingère 16 000 caractères par heure. Les prix sont indiqués pour 10 000 transactions.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    16,000 characters = 16,000 transactions
  4. Trouvez le prix horaire pour les 16 000 caractères que Gina ingère toutes les heures.
    hourly price = 
    (16,000 transactions ) / (10,000 transactions) x $<Embed-Cohere-unit-price>
  5. Trouvez le prix mensuel du mois le plus long de l'année.
    One month = 31 x 24 hours = 744 hours
    monthly price = 744 hours x hourly price