Pago por inferencias bajo demanda

Obtiene las siguientes ventajas al comprometerse a inferir bajo demanda en OCI Generative AI:

  • Baja barrera para empezar a utilizar la IA generativa.
  • Acceso a todos los modelos fundamentales de IA generativa disponibles.
  • Ideal para experimentar y evaluar los modelos.
  • Pay as you go para transacciones. Consulte la siguiente nota para obtener detalles.
Nota

Con la inferencia bajo demanda, paga a medida que avanza por las siguientes longitudes de caracteres:

  • Chat: longitud de petición de datos (en caracteres) + longitud de respuesta (en caracteres)
  • Incrustaciones de texto: longitud de entrada (en caracteres)

En la página Precios, 1 character se calcula como 1 transaction.

Si aloja modelos fundamentales o los ajusta en clusters de IA dedicados, se le cobrará la hora de unidad en lugar de la transacción. En este caso, consulte Pago por clusters de IA dedicados para aprender a calcular los costos de cluster de IA dedicados.

Coincidencia de modelos con precios bajo demanda

La página de fijación de precios muestra el precio de 10 000 transacciones bajo demanda cuando se utiliza el patio de recreo, la API o la CLI para la inferencia.

Vaya a la página modelos previamente entrenados y seleccione el modelo con el que desea trabajar. En la sección Modo bajo demanda, busque la información de página de precios para el modelo. A continuación, revise los ejemplos de esta sección para aprender a calcular el costo en función del número de caracteres de entrada y salida.

Ejemplo de chat

Paul llama al modelo meta.llama-3.3-70b-instruct con la siguiente petición de datos, que tiene 220 characters de longitud:

Genere un tono de producto para un micrófono compacto conectado por USB que pueda grabar sonido envolvente. El micrófono es más útil en la grabación de música o conversaciones. El micrófono también puede ser útil para grabar podcasts.

La respuesta del modelo es 2,205 characters larga. Pablo quiere saber el costo de esta llamada. Estos son los pasos para calcular el costo.

  1. Calcule la petición de datos + longitud de respuesta (en caracteres).

    Vamos a sumar la longitud de petición de datos (220 caracteres) y la longitud de respuesta del modelo (2.205 caracteres).

    prompt + response length = 220 + 2,205 = 2,425 characters
  2. Calcule el número de transacciones.

    Los precios se muestran para 10 000 transacciones.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    2,425 characters = 2,425 transactions
  3. Vaya a Precios de IA y, en OCI Generative AI, para Oracle Cloud Infrastructure Generative AI - Large Meta, busque <Large-Meta-unit-price>.
    Paul utiliza el modelo meta.llama-3.3-70b-instruct, que coincide con el producto, Generative AI OCI - Large Meta, en la página AI Pricing para la IA generativa.
  4. Calcule el precio para 1.838 caracteres.
    price = (2,425 transactions )/ (10,000 transactions) x $<Large-Meta-unit-price>
Consejo

Además de calcular el precio, puede estimar el costo seleccionando la categoría IA y aprendizaje automático y cargando el estimador de costos para OCI Generative AI.

Ejemplo de incrustaciones de texto

Gina está convirtiendo los contratos de clientes en incrustaciones para una nueva aplicación de búsqueda semántica. En promedio, Gina ingiere 16 documentos cada hora. Cada documento tiene una longitud aproximada de 1,000 characters. Gina quiere obtener una estimación de la factura mensual para generar esas incrustaciones. Estos son los pasos para calcular el costo.

  1. Calcule la longitud de entrada (en caracteres).

    Vamos a sumar la longitud del carácter de entrada para cada hora.

    input character length for 16 documents = 16 x 1,000 = 16,000 characters per hour
  2. Vaya a Precios de IA y, en OCI Generative AI, para Oracle Cloud Infrastructure Generative AI - Embed Cohere, busque <Embed-Cohere-unit-price>.
    Gina utiliza el modelo cohere.embed-v4.0, que coincide con el producto, Oracle Cloud Infrastructure Generative AI - Embed Cohere en la página Precios de IA para la IA generativa.
  3. Calcule el número de transacciones por hora.

    Gina ingiere 16.000 caracteres por hora. Los precios se muestran para 10 000 transacciones.

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    16,000 characters = 16,000 transactions
  4. Busque el precio por hora de los 16 000 caracteres que Gina ingiere por hora.
    hourly price = 
    (16,000 transactions ) / (10,000 transactions) x $<Embed-Cohere-unit-price>
  5. Encuentra el precio mensual para el mes más largo del año.
    One month = 31 x 24 hours = 744 hours
    monthly price = 744 hours x hourly price