Calcul du coût dans Generative AI

Dans OCI Generative AI, vous pouvez payer pour l'inférence à la demande ou les clusters d'IA dédiés :

Inférence à la demande
  • Vous payez au fur et à mesure.
  • Vous payez pour la longueur des caractères de chaque appel d'inférence.
  • Sur la page de tarification, lorsque vous voyez le prix du nombre de transactions, il s'agit du nombre de caractères dans les appels d'inférence. Une transaction est égale à un caractère.
Clusters d'IA dédiés
  • Vous disposez d'un ensemble dédié de GPU.
  • Vous pouvez affiner les modèles personnalisés sur les clusters d'IA dédiés.
  • Vous pouvez héberger des répliques de modèles fondamentaux et affinés sur les clusters d'IA dédiés.
  • Vous validez à l'avance certaines heures d'utilisation des clusters d'IA dédiés. Pour connaître les prix, reportez-vous à la page des tarifs.

Consultez les sujets et exemples suivants pour vous aider à choisir entre l'inférence à la demande ou l'utilisation de clusters d'IA dédiés et pour calculer le coût de chaque option.