Calcul du coût dans Generative AI
Dans OCI Generative AI, vous pouvez payer pour l'inférence à la demande ou les clusters d'IA dédiés :
- Inférence à la demande
-
- Vous payez au fur et à mesure.
- Vous payez pour la longueur de caractère de chaque appel d'inférence.
- Sur la page Tarification, lorsque vous voyez le prix du nombre de transactions, il s'agit du nombre de caractères dans les appels d'inférence. Une transaction est égale à un caractère.
- Clusters d'IA dédiés
-
- Vous disposez d'un ensemble dédié de GPU.
- Vous pouvez affiner les modèles personnalisés sur les clusters d'IA dédiés.
- Vous pouvez héberger des répliques de modèles fondamentaux et affinés sur les clusters AI dédiés.
- Vous vous engagez à l'avance à certaines heures d'utilisation des clusters d'IA dédiés. Pour connaître les prix, reportez-vous à la page des tarifs.
Consultez les rubriques et exemples suivants pour vous aider à choisir entre l'inférence à la demande ou l'utilisation de clusters AI dédiés et pour calculer le coût de chaque option.