Calculando o Custo no Serviço Generative AI
Na OCI Generative AI, você pode pagar por inferência on-demand ou clusters de IA dedicados:
- Inferência sob demanda
-
- Você paga conforme o uso.
- Você paga pelo tamanho do caractere de cada chamada de inferência.
- Na página de preços, quando você vê o preço do número de transações, esse é o número de caracteres nas chamadas de inferência. Uma transação é igual a um caractere.
- Clusters de IA Dedicados
-
- Você obtém um conjunto dedicado de GPUs.
- Você pode ajustar modelos personalizados nos clusters de IA dedicados.
- Você pode hospedar réplicas de modelos básicos e ajustados nos clusters de IA dedicados.
- Você se compromete com antecedência a determinadas horas de uso dos clusters de IA dedicados. Para preços, consulte a página de preços.
Revise os tópicos e exemplos a seguir para ajudá-lo a decidir entre inferência sob demanda ou uso de clusters de IA dedicados e calcular o custo de cada opção.