Calculando Custo em IA Generativa

Na OCI Generative AI, você pode pagar por inferências sob demanda ou clusters de IA dedicados:

Inferência sob demanda
  • Você paga como vai.
  • Você paga pelo tamanho do caractere de cada chamada de inferência.
  • Na página de preços, quando você vê o preço do número de transações, esse é o número de caracteres nas chamadas de inferência. Uma transação equivale a um caractere.
Clusters de IA Dedicados
  • Você obtém um conjunto dedicado de GPUs.
  • Você pode ajustar modelos personalizados nos clusters de IA dedicados.
  • Você pode hospedar réplicas de modelos básicos e ajustados nos clusters de IA dedicados.
  • Você se compromete antecipadamente com determinadas horas de uso dos clusters de IA dedicados. Para obter preços, consulte a página de preços.

Revise os tópicos e exemplos a seguir para ajudá-lo a decidir entre inferir sob demanda ou usar clusters de IA dedicados e calcular o custo de cada opção.