Paiement de l'inférence à la demande

Vous bénéficiez des avantages suivants avec la validation de l'inférence à la demande dans OCI Generative AI :

  • Faible barrière pour commencer à utiliser l'IA générative.
  • Accès à tous les modèles fondamentaux d'IA générative disponibles.
  • Idéal pour expérimenter et évaluer les modèles.
  • Paiement à l'utilisation des transactions Pay as you go. Pour plus d'informations, reportez-vous à la remarque suivante.
Remarque

Avec l'inférence à la demande, vous payez au fur et à mesure que vous utilisez les longueurs de caractères suivantes :

  • Discussion : longueur d'invite (en caractères) + longueur de réponse (en caractères)
  • Incorporation de texte : longueur d'entrée (en caractères)

Sur la page Tarification, 1 character est calculé comme suit : 1 transaction.

Si vous hébergez des modèles fondamentaux ou que vous les affinez sur des clusters d'IA dédiés, vous êtes facturé par heure d'unité plutôt que par transaction. Dans ce cas, reportez-vous à Paiement pour les clusters d'IA dédiés pour savoir comment calculer les coûts des clusters d'IA dédiés.

Mise en correspondance des modèles avec les prix à la demande

La page de tarification indique le prix de 10 000 transactions à la demande ou de 1 000 000 jetons lors de l'utilisation de la zone de lecture, de l'API ou de l'interface de ligne de commande pour l'inférence.

Accédez à la page Modèles préentraînés et sélectionnez le modèle que vous souhaitez utiliser. Dans la section Mode à la demande, recherchez les informations de page de tarification du modèle. Consultez ensuite les exemples de cette section pour savoir comment calculer le coût en fonction du nombre de caractères d'entrée et de sortie.

Exemple de discussion

Paul appelle le modèle meta.llama-3.3-70b-instruct avec l'invite suivante, longue de 220 characters :

Générez un pitch de produit pour un microphone compact connecté USB qui peut enregistrer le son surround. Le microphone est plus utile pour enregistrer de la musique ou des conversations. Le microphone peut également être utile pour enregistrer des podcasts.

La réponse du modèle est de 2,205 characters. Paul veut connaître le coût de cet appel. Voici les étapes pour calculer le coût.

  1. Calculez l'invite + longueur de réponse (en caractères).

    Additionnons la longueur de l'invite (220 caractères) et la longueur de la réponse du modèle (2 205 caractères).

    
                                        prompt + response length = 220 + 2,205 = 2,425 characters
  2. Calculer le nombre de transactions.

    Les prix sont indiqués pour 10 000 transactions.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    2,425 characters = 2,425 transactions
  3. Accédez à la page Tarification de l'IA et sous OCI Generative AI, pour Oracle Cloud Infrastructure Generative AI - Large Meta, recherchez <Large-Meta-unit-price> .
    Paul utilise le modèle meta.llama-3.3-70b-instruct qui correspond au produit, OCI d'IA générative - Grand méta sur la page Tarifs de l'IA pour l'IA générative.
  4. Calculez le prix pour 1 838 caractères.
    price = (2,425 transactions )/ (10,000 transactions) x $<Large-Meta-unit-price>
                                    
Conseil

Outre le calcul du prix, vous pouvez estimer le coût en sélectionnant la catégorie IA et apprentissage automatique et en chargeant l'évaluateur de coûts pour OCI Generative AI.

Exemple d'incorporation de texte

Gina convertit les contrats clients en intégrations pour une nouvelle application de recherche sémantique. En moyenne, Gina ingère 16 documents par heure. Chaque document est d'environ 1,000 characters. Gina veut obtenir une estimation de la facture mensuelle pour la génération de ces incorporations. Voici les étapes pour calculer le coût.

  1. Calculez la longueur en entrée (en caractères).

    Additionnons la longueur des caractères d'entrée pour chaque heure.

    
                                        input character length for 16 documents = 16 x 1,000 = 16,000 characters per hour
  2. Accédez à la tarification de l'IA et sous OCI Generative AI, pour Oracle Cloud Infrastructure Generative AI - Embed Cohere, recherchez le site <Embed-Cohere-unit-price>.
    Gina utilise le modèle cohere.embed-v4.0 qui correspond au produit, Oracle Cloud Infrastructure Generative AI - Embed Cohere sur la page Tarifs de l'IA pour l'IA générative.
  3. Calculer le nombre de transactions par heure.

    Gina ingère 16 000 caractères par heure. Les prix sont indiqués pour 10 000 transactions.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    16,000 characters = 16,000 transactions
  4. Trouvez le prix horaire pour les 16 000 caractères que Gina ingère toutes les heures.
    hourly price = 
    (16,000 transactions ) / (10,000 transactions) x $<Embed-Cohere-unit-price>
                                    
  5. Trouvez le prix mensuel pour le mois le plus long de l'année.
    One month = 31 x 24 hours = 744 hours
    monthly price = 744 hours x hourly price