Payer pour l'inférence sur demande

Vous bénéficiez des avantages suivants en vous engageant à utiliser l'inférence sur demande dans le service d'intelligence artificielle générative pour OCI :

  • Faible barrière pour commencer à utiliser l'IA générative.
  • Accès à tous les modèles fondamentaux du service d'intelligence artificielle générative disponibles.
  • Idéal pour expérimenter et évaluer les modèles.
  • Pay as you go pour les transactions. Voir la note suivante pour plus de détails.
Note

Avec l'inférence sur demande, vous payez à l'utilisation pour les longueurs de caractères suivantes :

  • Clavardage : longueur de l'invite (en caractères) + longueur de la réponse (en caractères)
  • Intégration de texte : Longueur d'entrée (en caractères)

Dans la page des tarifs, 1 character est calculé comme suit : 1 transaction.

Si vous hébergez des modèles fondamentaux ou que vous les réglez avec précision sur des grappes d'IA dédiées, vous êtes facturé en heure d'unité plutôt qu'en transaction. Dans ce cas, voir Paiement des grappes dédiées à l'IA pour savoir comment calculer les coûts des grappes dédiées à l'IA .

Rapprochement des modèles aux prix sur demande

La page de tarification répertorie le prix de 10 000 transactions sur demande ou de 1 000 000 jetons lors de l'utilisation du terrain de jeu, de l'API ou de l'interface de ligne de commande pour l'inférence.

Allez à la page Modèles préentraînés et sélectionnez le modèle avec lequel vous voulez travailler. Dans la section Mode sur demande, recherchez les informations sur la page de tarification pour le modèle. Ensuite, consultez les exemples de cette section pour apprendre à calculer le coût en fonction du nombre de caractères d'entrée et de sortie.

Exemple de clavardage

Paul appelle le modèle meta.llama-3.3-70b-instruct avec l'invite suivante, qui est longue de 220 characters :

Générez une présentation de produit pour un microphone compact connecté USB qui peut enregistrer le son surround. Le microphone est le plus utile pour enregistrer de la musique ou des conversations. Le microphone peut également être utile pour enregistrer des podcasts.

La réponse du modèle est longue de 2,205 characters. Paul veut connaître le coût de cet appel. Voici les étapes à suivre pour calculer le coût.

  1. Calculez l'invite + longueur de la réponse (en caractères).

    Ajoutons la longueur de l'invite (220 caractères) et la longueur de la réponse du modèle (2 205 caractères).

    
                                        prompt + response length = 220 + 2,205 = 2,425 characters
  2. Calculez le nombre de transactions.

    Les prix sont répertoriés pour 10 000 transactions.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    2,425 characters = 2,425 transactions
  3. Allez à Tarifs pour l'IA et, sous OCI Generative AI, pour Oracle Cloud Infrastructure Generative AI - Large Meta, trouvez <Large-Meta-unit-price> .
    Paul utilise le modèle meta.llama-3.3-70b-instruct qui correspond au produit, Generative AI OCI - Large Meta dans la page Tarifs pour l'IA pour l'IA générative.
  4. Calculez le prix pour 1 838 caractères.
    price = (2,425 transactions )/ (10,000 transactions) x $<Large-Meta-unit-price>
                                    
Conseil

En plus de calculer le prix, vous pouvez estimer le coût en sélectionnant la catégorie IA et apprentissage automatique et en chargeant l'estimateur de coûts pour OCI Generative AI.

Exemple d'intégration de texte

Gina convertit les contrats de client en intégrations pour une nouvelle application de recherche sémantique. En moyenne, Gina ingère 16 documents toutes les heures. Chaque document est d'environ 1,000 characters long. Gina veut obtenir une estimation de la facture mensuelle pour la génération de ces plongements. Voici les étapes à suivre pour calculer le coût.

  1. Calculez la longueur d'entrée (en caractères).

    Ajoutons la longueur du caractère d'entrée pour chaque heure.

    
                                        input character length for 16 documents = 16 x 1,000 = 16,000 characters per hour
  2. Allez à Tarifs pour l'IA et, sous OCI Generative AI, pour Oracle Cloud Infrastructure Generative AI - Embed Cohere, recherchez <Embed-Cohere-unit-price>.
    Gina utilise le modèle cohere.embed-v4.0 qui correspond au produit, Oracle Cloud Infrastructure Generative AI - Embed Cohere dans la page Tarifs pour l'IA pour l'IA générative.
  3. Calculez le nombre de transactions par heure.

    Gina ingère 16 000 caractères par heure. Les prix sont répertoriés pour 10 000 transactions.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    16,000 characters = 16,000 transactions
  4. Recherchez le prix horaire des 16 000 caractères ingérés par Gina toutes les heures.
    hourly price = 
    (16,000 transactions ) / (10,000 transactions) x $<Embed-Cohere-unit-price>
                                    
  5. Trouvez le prix mensuel pour le plus long mois de l'année.
    One month = 31 x 24 hours = 744 hours
    monthly price = 744 hours x hourly price