Pagando por Inferência sob Demanda
Você obtém os seguintes benefícios ao se comprometer com a inferência sob demanda na OCI Generative AI:
- Baixa barreira para começar a usar a IA generativa.
- Acesso a todos os modelos de base de IA generativa disponíveis.
- Ótimo para experimentar e avaliar os modelos.
- Pay as you go para transações. Consulte a observação a seguir para obter detalhes.
Com a inferência sob demanda, você paga conforme vai pelos seguintes comprimentos de caracteres:
- Bate-papo: tamanho do prompt (em caracteres) + tamanho da resposta (em caracteres)
- Incorporações de Texto: tamanho da entrada (em caracteres)
Na página Preços, 1 character é calculado como 1 transaction.
Se você estiver hospedando modelos básicos ou ajustando-os em clusters de IA dedicados, será cobrado pela hora da unidade em vez de pela transação. Nesse caso, consulte Pagando por Clusters de IA Dedicados para saber como calcular os custos do cluster de IA dedicado.
Correspondendo Modelos a Preços sob Demanda
A página de preços lista o preço de 10.000 transações sob demanda ao usar o playground, a API ou a CLI para inferência.
Vá para a página modelos pré-treinados e selecione o modelo com o qual deseja trabalhar. Na seção Modo sob Demanda, localize as Informações da Página de Preços para o modelo. Em seguida, revise os exemplos nesta seção para saber como calcular o custo com base no número de caracteres de entrada e saída.
Exemplo de Chat
Paul chama o modelo meta.llama-3.3-70b-instruct com o seguinte prompt, que é 220 characters longo:
Gere um passo de produto para um microfone compacto conectado por USB que possa gravar o som surround. O microfone é mais útil na gravação de música ou conversas. O microfone também pode ser útil para gravar podcasts.
A resposta do modelo é 2,205 characters longa. Paulo quer saber o custo desta chamada. Aqui estão as etapas para calcular o custo.
Além de calcular o preço, você pode estimar o custo selecionando a categoria IA e Machine Learning e carregando o estimador de custos para a OCI Generative AI.
Exemplo de Incorporações de Texto
A Gina está convertendo contratos de clientes em incorporações para um novo aplicativo de pesquisa semântica. Em média, Gina ingere 16 documentos a cada hora. Cada documento é de aproximadamente 1,000 characters longo. Gina quer obter uma estimativa da conta mensal para gerar esses embeddings. Aqui estão as etapas para calcular o custo.