Calculando Custo em IA Gerativa

Na IA Gerativa do OCI, você pode pagar por clusters de IA sob demanda ou dedicados:

Inferência sob demanda
  • Você paga enquanto vai.
  • Você paga pelo tamanho do caractere de cada chamada de inferência.
  • Na página de preços, quando você vê o preço do número de transações, esse é o número de caracteres nas chamadas de inferência. Uma transação é igual a um caractere.
Clusters de IA Dedicados
  • Você obtém um conjunto dedicado de GPUs.
  • Você pode ajustar modelos personalizados nos clusters de IA dedicados.
  • Você pode hospedar réplicas de modelos básicos e ajustados nos clusters de IA dedicados.
  • Você se compromete antecipadamente a determinadas horas de uso dos clusters de IA dedicados. Para obter preços, consulte a página de preços.

Revise os tópicos e exemplos a seguir para ajudá-lo a decidir entre inferir sob demanda ou usar clusters de IA dedicados e calcular o custo de cada opção.