Cálculo de costo en IA generativa

En OCI Generative AI, puedes pagar por inferencias a demanda o clusters de IA dedicados:

Inferencia bajo demanda
  • Usted paga sobre la marcha.
  • Usted paga por la longitud de caracteres de cada llamada de inferencia.
  • En la página de precios, cuando vea el precio del número de transacciones, ese es el número de caracteres en las llamadas de inferencia. Una transacción es igual a un carácter.
Clusters de IA dedicados
  • Obtiene un juego dedicado de GPU.
  • Puede ajustar modelos personalizados en los clusters de IA dedicados.
  • Puede alojar réplicas de modelos básicos y ajustados en los clusters de IA dedicados.
  • Se compromete con antelación a determinadas horas de uso de los clusters de IA dedicados. Para ver los precios, consulte la página de precios.

Revise los siguientes temas y ejemplos para ayudarle a decidir entre la inferencia bajo demanda o el uso de clusters de IA dedicados y calcular el costo de cada opción.