Calculando o Custo no Serviço Generative AI

Na OCI Generative AI, você pode pagar por inferência on-demand ou clusters de IA dedicados:

Inferência sob demanda
  • Você paga conforme o uso.
  • Você paga pelo tamanho do caractere de cada chamada de inferência.
  • Na página de preços, quando você vê o preço do número de transações, esse é o número de caracteres nas chamadas de inferência. Uma transação é igual a um caractere.
Clusters de IA Dedicados
  • Você obtém um conjunto dedicado de GPUs.
  • Você pode ajustar modelos personalizados nos clusters de IA dedicados.
  • Você pode hospedar réplicas de modelos básicos e ajustados nos clusters de IA dedicados.
  • Você se compromete com antecedência a determinadas horas de uso dos clusters de IA dedicados. Para preços, consulte a página de preços.

Revise os tópicos e exemplos a seguir para ajudá-lo a decidir entre inferência sob demanda ou uso de clusters de IA dedicados e calcular o custo de cada opção.