Pagando por Inferência sob Demanda

Você obtém os seguintes benefícios confirmando a inferência sob demanda na IA Gerativa do OCI:

  • Baixa barreira para começar a usar a IA Gerativa.
  • Acesso a todos os modelos básicos de IA generativa disponíveis.
  • Ótimo para experimentar e avaliar os modelos.
  • Pay as you go para transações. Consulte a observação a seguir para obter detalhes.
Observação

Com a inferência sob demanda, você paga conforme vai pelos seguintes comprimentos de caracteres:

  • Bate-papo: tamanho do prompt (em caracteres) + tamanho da resposta (em caracteres)
  • Geração de texto: tamanho do prompt (em caracteres) + tamanho da resposta (em caracteres)
  • Resumo: tamanho do prompt (em caracteres) + tamanho da resposta (em caracteres)
  • Incorporações de Texto: tamanho da entrada (em caracteres)

Os exemplos a seguir calculam o custo de inferência sob demanda para geração de texto e incorporações de texto no OCI Generative AI. Para calcular o custo do cluster do AI dedicado, consulte Pagando por Clusters do AI Dedicados.

Correspondendo um Modelo Fundamental a um Produto

Para localizar o preço unitário de 10.000 transações de inferência sob demanda, corresponda ao modelo básico usado para inferência ao produto na tabela a seguir.

Recurso Modelo Base Fundamental Produto para Inferência sob Demanda na Página Preços
Chat meta.llama-3-70b-instruct Oracle Cloud Infrastructure IA Gerativa - Grande Meta
Chat cohere.command-r-plus Oracle Cloud Infrastructure IA Gerativa - Grande Cohere V2
Chat cohere.command-r-16k Oracle Cloud Infrastructure IA Gerativa - Small Cohere V2
Geração de Texto cohere.command Oracle Cloud Infrastructure IA Gerativa - Grande Cohere
Geração de Texto cohere.command-light Oracle Cloud Infrastructure IA Gerativa - Small Cohere
Geração de Texto meta.llama2_70b-chat Oracle Cloud Infrastructure IA Gerativa - Grande Meta
Sumarização cohere.command Oracle Cloud Infrastructure IA Gerativa - Grande Cohere
Incorporação cohere.embed Oracle Cloud Infrastructure IA Gerativa - Incorpore a Cohere

Os exemplos a seguir calculam o custo de inferência sob demanda para geração de texto e incorporações de texto no OCI Generative AI. Para calcular o custo do cluster do AI dedicado, consulte Pagando por Clusters do AI Dedicados.

Exemplo de Chat

Paul chama o modelo meta.llama-3-70b-instruct com o seguinte prompt, que é 220 characters longo:

Gere um passo de produto para um microfone compacto conectado por USB que possa gravar o som surround. O microfone é mais útil na gravação de música ou conversas. O microfone também pode ser útil para gravar podcasts.

A resposta do modelo é 1,618 characters longa. Paulo quer saber o custo desta chamada. Aqui estão as etapas para calcular o custo.

  1. Calcule o tamanho do prompt + resposta (em caracteres).

    Vamos adicionar o tamanho do prompt (220 caracteres) e o tamanho da resposta do modelo (1.618 caracteres).

    prompt + response length = 220 + 1,618 = 1,838 characters
  2. Calcule o número de transações.

    Os preços são listados para 10.000 transações.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    1,838 characters = 1,838 transactions
  3. Vá para Preços de IA e, em IA Generativa da OCI, para Oracle Cloud Infrastructure Generative AI - Large Meta, localize o <Large-Meta-unit-price> para 10.000 transações.
    Paul usa o modelo meta.llama-3-70b-instruct que corresponde ao produto, Oracle Cloud Infrastructure IA Gerativa - Meta Grande na página Preços de IA para IA Gerativa.
  4. Calcule o preço de 1.838 caracteres.
    price = (1,838 transactions )/ (10,000 transactions) x $<Large-Meta-unit-price>

Exemplo de Geração de Texto

Paul chama o modelo cohere.command com o seguinte prompt, que é 220 characters longo:

Gere um passo de produto para um microfone compacto conectado por USB que possa gravar o som surround. O microfone é mais útil na gravação de música ou conversas. O microfone também pode ser útil para gravar podcasts.

A resposta do modelo é 1,618 characters longa. Paulo quer saber o custo desta chamada. Aqui estão as etapas para calcular o custo.

  1. Calcule o tamanho do prompt + resposta (em caracteres).

    Vamos adicionar o tamanho do prompt (220 caracteres) e o tamanho da resposta do modelo (1.618 caracteres).

    prompt + response length = 220 + 1,618 = 1,838 characters
  2. Calcule o número de transações.

    Os preços são listados para 10.000 transações.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    1,838 characters = 1,838 transactions
  3. Vá para Preços de IA e, em OCI Generative AI, para Oracle Cloud Infrastructure Generative AI - Large Cohere, localize o <Large-Cohere-unit-price> para 10.000 transações.
    Paul usa o modelo cohere.command que corresponde ao produto, Oracle Cloud Infrastructure Generative AI - Large Cohere na página Preços de IA para IA Gerativa.
  4. Calcule o preço de 1.838 caracteres.
    price = (1,838 transactions )/ (10,000 transactions) x $<Large-Cohere-unit-price>

Exemplo de Incorporações de Texto

A Gina está convertendo contratos de clientes em incorporações para um novo aplicativo de pesquisa semântica. Em média, Gina ingere 16 documentos a cada hora. Cada documento é de aproximadamente 1,000 characters longo. Gina quer obter uma estimativa da conta mensal para gerar esses embeddings. Aqui estão as etapas para calcular o custo.

  1. Calcule o tamanho de entrada (em caracteres).

    Vamos adicionar o comprimento do caractere de entrada para cada hora.

    input character length for 16 documents = 16 x 1,000 = 16,000 characters per hour
  2. Vá para Preços de IA e, em IA Generativa da OCI, para Oracle Cloud Infrastructure Generative AI - Embed Cohere, localize o <Embed-Cohere-unit-price> para 10.000 transações.
    Gina usa o modelo cohere.embed que corresponde ao produto, Oracle Cloud Infrastructure IA Gerativa - Incorporar Cohere na página Preços de IA para IA Gerativa.
  3. Calcule o número de transações por hora.

    Gina ingere 16.000 caracteres por hora. Os preços são listados para 10.000 transações.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    16,000 characters = 16,000 transactions
  4. Encontre o preço por hora dos 16.000 caracteres que Gina ingere por hora.
    hourly price = 
    (16,000 transactions )/ (10,000 transactions) x $<Embed-Cohere-unit-price>
  5. Encontre o preço mensal para o mês mais longo do ano.
    One month = 31 x 24 hours = 744 hours
    monthly price = 744 hours x hourly price