Calculando Custo em IA Gerativa
Na IA Gerativa do OCI, você pode pagar por clusters de IA sob demanda ou dedicados:
- Inferência sob demanda
-
- Você paga enquanto vai.
- Você paga pelo tamanho do caractere de cada chamada de inferência.
- Na página de preços, quando você vê o preço do número de transações, esse é o número de caracteres nas chamadas de inferência. Uma transação é igual a um caractere.
- Clusters de IA Dedicados
-
- Você obtém um conjunto dedicado de GPUs.
- Você pode ajustar modelos personalizados nos clusters de IA dedicados.
- Você pode hospedar réplicas de modelos básicos e ajustados nos clusters de IA dedicados.
- Você se compromete antecipadamente a determinadas horas de uso dos clusters de IA dedicados. Para obter preços, consulte a página de preços.
Revise os tópicos e exemplos a seguir para ajudá-lo a decidir entre inferir sob demanda ou usar clusters de IA dedicados e calcular o custo de cada opção.