Pagando por Inferência sob Demanda
Você obtém os seguintes benefícios ao se comprometer com a inferência sob demanda na OCI Generative AI:
- Baixa barreira para começar a usar a IA generativa.
- Acesso a todos os modelos de base de IA generativa disponíveis.
- Ótimo para experimentar e avaliar os modelos.
- Pay as you go para transações. Consulte a observação a seguir para obter detalhes.
Com a inferência sob demanda, você paga conforme vai pelos seguintes comprimentos de caracteres:
- Bate-papo: tamanho do prompt (em caracteres) + tamanho da resposta (em caracteres)
- Incorporações de Texto: tamanho da entrada (em caracteres)
Na página Preços, 1 character
é calculado como 1 transaction
.
Se você estiver hospedando modelos fundamentais ou ajustando-os em clusters de IA dedicados, será cobrado pela hora da unidade em vez da transação. Nesse caso, consulte Pagando por Clusters de IA Dedicados para saber como calcular os custos de cluster de IA dedicados.
Correspondendo Modelos a Preços sob Demanda
Consulte as tabelas a seguir para corresponder um modelo básico ao nome do produto na página de preços. A página de preços lista o preço de 10.000 transações sob demanda ao usar o playground, a API ou a CLI para inferência.
Modelos de Chat
Nome do Modelo | Nome do Modelo do OCI | Nome do Produto da Página de Preços |
---|---|---|
Cohere Command A | cohere.command-a-03-2025 |
Large Cohere |
Cohere Command R 08-2024 | cohere.command-r-08-2024 |
Small Cohere |
Cohere Command R+ 08-2024 | cohere.command-r-plus-08-2024 |
Large Cohere |
Cohere Command R | cohere.command-r-16k (obsoleto) |
Small Cohere |
Cohere Command R+ | cohere.command-r-plus (obsoleto) |
Large Cohere |
Meta Llama 4 Maverick | meta.llama-4-maverick-17b-128e-instruct-fp8 |
Meta Llama 4 Maverick |
Meta Llama 4 Scout | meta.llama-4-scout-17b-16e-instruct |
Meta Llama 4 Scout |
Meta Lama 3.3 | meta.llama-3.3-70b-instruct |
Large Meta |
Meta Llama 3.2 11B Vision | meta.llama-3.2-11b-vision-instruct |
Large Meta |
Meta Llama 3.2 90B Vision | meta.llama-3.2-90b-vision-instruct |
Large Meta |
Meta Llama 3.1 (70B) | meta.llama-3.1-70b-instruct |
Large Meta |
Meta Llama 3.1 (405B) | meta.llama-3.1-405b-instruct |
Meta Llama 3.1 405B |
Meta Llama 3 | meta.llama-3-70b-instruct (obsoleto) |
Large Meta |
Os modelos de resumo e geração de texto suportados para o modo sob demanda agora estão retirados. Recomendamos que você use os modelos de chat.
Incorporando Modelos
Nome do Modelo | Nome do Modelo do OCI | Nome do Produto da Página de Preços |
---|---|---|
Cohere Incorporar Imagem em Inglês V3 | cohere.embed-english-image-v3.0 |
Embed Cohere |
Cohere Embed Multilingual Image V3 | cohere.embed-multilingual-image-v3.0 |
Embed Cohere |
Cohere Embed English Light Image V3 | cohere.embed-english-light-image-v3.0 |
Embed Cohere |
Cohere Embed Multilingual Light Image V3 | cohere.embed-multilingual-light-image-v3.0 |
Embed Cohere |
Cohere Embed English V3 | cohere.embed-english-v3.0 |
Embed Cohere |
Cohere Embed Multilingual V3 | cohere.embed-multilingual-v3.0 |
Embed Cohere |
Cohere Embed English Light V3 | cohere.embed-english-light-v3.0 |
Embed Cohere |
Cohere Embed Multilingual Light V3 | cohere.embed-multilingual-light-v3.0 |
Embed Cohere |
Exemplo de Chat
Paul chama o modelo meta.llama-3.3-70b-instruct
com o seguinte prompt, que é 220 characters
longo:
Gere um passo de produto para um microfone compacto conectado por USB que possa gravar o som surround. O microfone é mais útil na gravação de música ou conversas. O microfone também pode ser útil para gravar podcasts.
A resposta do modelo é 2,205 characters
longa. Paulo quer saber o custo desta chamada. Aqui estão as etapas para calcular o custo.
Além de calcular o preço, você pode estimar o custo selecionando a categoria IA e Machine Learning e carregando o estimador de custos para a OCI Generative AI.
Exemplo de Incorporações de Texto
A Gina está convertendo contratos de clientes em incorporações para um novo aplicativo de pesquisa semântica. Em média, Gina ingere 16 documentos a cada hora. Cada documento é de aproximadamente 1,000 characters
longo. Gina quer obter uma estimativa da conta mensal para gerar esses embeddings. Aqui estão as etapas para calcular o custo.