Calcul du coût dans Generative AI

Dans OCI Generative AI, vous pouvez payer pour l'inférence à la demande ou les clusters d'IA dédiés :

Inférence à la demande
  • Vous payez au fur et à mesure.
  • Vous payez pour la longueur de caractère de chaque appel d'inférence.
  • Sur la page Tarification, lorsque vous voyez le prix du nombre de transactions, il s'agit du nombre de caractères dans les appels d'inférence. Une transaction est égale à un caractère.
Clusters d'IA dédiés
  • Vous disposez d'un ensemble dédié de GPU.
  • Vous pouvez affiner les modèles personnalisés sur les clusters d'IA dédiés.
  • Vous pouvez héberger des répliques de modèles fondamentaux et affinés sur les clusters AI dédiés.
  • Vous vous engagez à l'avance à certaines heures d'utilisation des clusters d'IA dédiés. Pour connaître les prix, reportez-vous à la page des tarifs.

Consultez les rubriques et exemples suivants pour vous aider à choisir entre l'inférence à la demande ou l'utilisation de clusters AI dédiés et pour calculer le coût de chaque option.