Pago por clusters de IA dedicados

Obtiene las siguientes ventajas para utilizar clusters de IA dedicados en OCI Generative AI:

  • Precios predecibles que no fluctúan con la demanda.
  • Ideal para modelos de ajuste o alojamiento.
  • Compromiso mínimo de alojamiento: 744 horas unitarias por cluster de hosting.
  • Compromiso mínimo de ajuste: 1 unidad/hora por trabajo de ajuste fino. (Dependiendo del modelo, el ajuste fino requiere al menos 2 unidades para ejecutarse).
Nota

Para averiguar qué modelos están disponibles para el ajuste, consulte Coincidencia de modelos base con clusters.

Los siguientes ejemplos calculan el costo del cluster de IA dedicado en OCI Generative AI. Para calcular el costo de inferencia bajo demanda, consulte Pago de inferencias bajo demanda.

Comparación de modelos con precios de unidades de cluster dedicadas

Si está alojando modelos fundamentales o ajustándolos en clusters de IA dedicados, se le cobrará la hora de unidad en lugar de por transacción. En este caso, consulte la siguiente tabla para calcular el costo del cluster de IA dedicado para los modelos de chat.

Importante

Algunos modelos base preentrenados fundamentales de OCI Generative AI soportados para el modo de servicio dedicado ahora están en desuso y se retirarán antes de que transcurran 6 meses desde el lanzamiento del 1er modelo de reemplazo. Puede alojar un modelo base o ajustar un modelo base y alojar el modelo ajustado en un cluster de IA dedicado (modo de servicio dedicado) hasta que el modelo base se retiró. Para conocer las fechas de baja del modo de servicio dedicado, consulte Baja de los modelos.

Modelos de chat

Modelo base Cluster de ajuste Alojamiento de cluster Información de Página de Precios Solicitar aumento del límite de cluster
  • Nombre de modelo: Meta Llama 4 Maverick
  • Nombre del modelo de OCI: meta.llama-4-maverick-17b-128e-instruct-fp8
No disponible para ajuste fino
  • Tamaño de unidad: Large Generic 2
  • Unidades necesarias: 1
  • Nombre de producto de página de precios: Large Meta - Dedicated
  • Nombre de límite: dedicated-unit-llama2-70-count
  • Para el alojamiento, solicitar un aumento del límite en: 4
  • Nombre de modelo: Meta Llama 4 Scout
  • Nombre del modelo de OCI: meta.llama-4-scout-17b-16e-instruct
No disponible para ajuste fino
  • Tamaño de unidad: Large Generic V2
  • Unidades necesarias: 1
  • Nombre de producto de página de precios: Large Meta - Dedicated
  • Nombre de límite: dedicated-unit-llama2-70-count
  • Para nuestro hosting, solicita un aumento del límite en: 2
  • Nombre de modelo: Cohere Command A
  • Nombre del modelo de OCI: cohere.command-a-03-2025
No disponible para ajuste fino
  • Tamaño de unidad: LARGE_COHERE_V3
  • Unidades necesarias: 1
  • Nombre de producto de página de precios: Large Cohere - Dedicated
  • Nombre de límite: dedicated-unit-large-cohere-count
  • Para el Hosting, solicita un Aumento del Límite de Solicitudes en: 1
  • Nombre de modelo: Cohere Command R
  • Nombre del modelo de OCI: cohere.command-r-16k (en desuso)
  • Tamaño de unidad: Small Cohere V2
  • Unidades necesarias: 8
  • Tamaño de unidad: Small Cohere V2
  • Unidades necesarias: 1
  • Nombre de producto de página de precios: Small Cohere - Dedicated
  • Para el ajuste, multiplique el precio unitario: x8
  • Nombre de límite: dedicated-unit-small-cohere-count
  • Para el Hosting, solicita un Aumento del Límite de Solicitudes en: 1
  • Para el ajuste, solicite un aumento del límite en: 8
  • Nombre de modelo: Command R 08-2024
  • Nombre de modelo de OCI: cohere.command-r-08-2024
  • Tamaño de unidad: Small Cohere V2
  • Unidades necesarias: 8
  • Tamaño de unidad: Small Cohere V2
  • Unidades necesarias: 1
  • Nombre de producto de página de precios: Small Cohere - Dedicated
  • Para el ajuste, multiplique el precio unitario: x8
  • Nombre de límite: dedicated-unit-small-cohere-count
  • Para el alojamiento, solicite un aumento del límite en: 1
  • Para el ajuste, solicite un aumento del límite en: 8
  • Nombre de modelo: Cohere Command R+
  • Nombre del modelo de OCI: cohere.command-r-plus (en desuso)
No disponible para ajuste fino
  • Tamaño de unidad: Large Cohere V2_2
  • Unidades necesarias: 1
  • Nombre de producto de página de precios: Large Cohere - Dedicated
  • Para el Alojamiento, Multiplique el Precio Unitario: x2
  • Nombre de límite: dedicated-unit-large-cohere-count
  • Para nuestro hosting, solicita un aumento del límite en: 2
  • Nombre de modelo: Command R+ 08-2024
  • Nombre de modelo de OCI: cohere.command-r-plus-08-2024
No disponible para ajuste fino
  • Tamaño de unidad: Large Cohere V2_2
  • Unidades necesarias: 1
  • Nombre del Producto de la Página de Precios: Large Cohere - Dedicated
  • Para el Alojamiento, Multiplique el Precio Unitario: x2
  • Nombre de límite: dedicated-unit-large-cohere-count
  • Para nuestro hosting, solicita un aumento del límite en: 2
  • Nombre de modelo: Meta Llama 3.3 (70B)
  • Nombre de modelo de OCI: meta.llama-3.3-70b-instruct
  • Tamaño de unidad: Large Generic
  • Unidades necesarias: 2
  • Tamaño de unidad: Large Generic
  • Unidades necesarias: 1
  • Nombre de producto de página de precios: Large Meta - Dedicated
  • Para el Alojamiento, Multiplique el Precio Unitario: x2
  • Para el ajuste, multiplique el precio unitario: x4
  • Nombre de límite: dedicated-unit-llama2-70-count
  • Para nuestro hosting, solicita un aumento del límite en: 2
  • Para el ajuste, solicite un aumento del límite en: 4
  • Nombre de modelo: Meta Llama 3.2 11B Vision
  • Nombre de modelo de OCI: meta.llama-3.2-11b-vision-instruct
No disponible para ajuste fino
  • Tamaño de unidad: Small Generic V2
  • Unidades necesarias: 1
  • Nombre de producto de página de precios: Large Meta - Dedicated
  • Para Hosting, Multiplique el Precio Unitario: x(0.5)
  • Nombre de límite: dedicated-unit-llama2-70-count
  • Para el Hosting, Solicite un Aumento del Límite en:1
  • Nombre de modelo: Meta Llama 3.2 90B Vision
  • Nombre de modelo de OCI: meta.llama-3.2-90b-vision-instruct
No disponible para ajuste
  • Tamaño de unidad: Large Generic V2
  • Unidades necesarias: 1
  • Nombre de producto de página de precios: Large Meta - Dedicated
  • Para el Alojamiento, Multiplique el Precio Unitario: x2
  • Nombre de límite: dedicated-unit-llama2-70-count
  • Para nuestro hosting, solicita un aumento del límite en: 2
  • Nombre de modelo: Meta Llama 3.1 (70B)
  • Nombre de modelo de OCI: meta.llama-3.1-70b-instruct
  • Tamaño de unidad: Large Generic
  • Unidades necesarias: 2
  • Tamaño de unidad: Large Generic
  • Unidades necesarias: 1
  • Nombre de producto de página de precios: Large Meta - Dedicated
  • Para el Alojamiento, Multiplique el Precio Unitario: x2
  • Para el ajuste, multiplique el precio unitario: x4
  • Nombre de límite: dedicated-unit-llama2-70-count
  • Para nuestro hosting, solicita un aumento del límite en: 2
  • Para el ajuste, solicite un aumento del límite en: 4
  • Nombre de modelo: Meta Llama 3.1 (405B)
  • Nombre de modelo de OCI: meta.llama-3.1-405b-instruct
No disponible para ajuste
  • Tamaño de unidad: Large Generic 2
  • Unidades necesarias: 1
  • Nombre del Producto de la Página de Precios: Large Meta - Dedicated
  • Para el Alojamiento, Multiplique el Precio Unitario: x4
  • Nombre de límite: dedicated-unit-llama2-70-count
  • Para el alojamiento, solicitar un aumento del límite en: 4
  • Nombre de modelo: Meta Llama 3
  • Nombre del modelo de OCI: meta.llama-3-70b-instruct (en desuso)
  • Tamaño de unidad: Large Generic
  • Unidades necesarias: 2
  • Tamaño de unidad: Large Generic
  • Unidades necesarias: 1
  • Nombre del Producto de la Página de Precios: Large Meta - Dedicated
  • Para el Alojamiento, Multiplique el Precio Unitario: x2
  • Para el ajuste, multiplique el precio unitario: x4
  • Nombre de límite: dedicated-unit-llama2-70-count
  • Para el alojamiento, solicite un aumento del límite en: 2
  • Para el ajuste, solicite un aumento del límite en: 4
Importante

Debe solicitar un aumento del límite para utilizar los siguientes recursos:

Familia Meta Llama

  • Para alojar un modelo Meta Llama 4 Maverick, debe solicitar que dedicated-unit-llama2-70-count aumente en 4.

  • Para alojar un modelo Meta Llama 4 Scout, debe solicitar que dedicated-unit-llama2-70-count aumente en 2.

  • Para alojar un modelo Meta Llama 3.3 (70B), debe solicitar dedicated-unit-llama2-70-count para aumentar en 2.

  • Para ajustar un modelo Meta Llama 3.3 (70B), debe solicitar dedicated-unit-llama2-70-count para aumentar en 4.

  • Para alojar un modelo Meta Llama 3.2 11B Vision , debe solicitar dedicated-unit-llama2-70-count para aumentar en 1.

  • Para alojar un modelo Meta Llama 3.2 90B Vision , debe solicitar dedicated-unit-llama2-70-count para aumentar en 2.

  • Para alojar un modelo Meta Llama 3.1 (70B), debe solicitar dedicated-unit-llama2-70-count para aumentar en 2.

  • Para ajustar un modelo Meta Llama 3.1 (70B), debe solicitar dedicated-unit-llama2-70-count para aumentar en 4.

  • Para alojar un modelo Meta Llama 3.1 (405B), debe solicitar dedicated-unit-llama2-70-count para aumentar en 4.

Familia de Comandos de Cohere

  • Para alojar un modelo Cohere Command A, debe solicitar que dedicated-unit-large-cohere-count aumente en 1.

  • Para alojar un modelo Cohere Command R (en desuso), debe solicitar que dedicated-unit-small-cohere-count aumente en 1.

  • Para ajustar un modelo Cohere Command R (en desuso), debe solicitar que dedicated-unit-small-cohere-count aumente en 8.

  • Para alojar un modelo Cohere Command R 08-2024, debe solicitar dedicated-unit-small-cohere-count para aumentar en 1.

  • Para ajustar un modelo Cohere Command R 08-2024, debe solicitar dedicated-unit-small-cohere-count para aumentar en 8.

  • Para alojar un modelo Cohere Command R+ (en desuso), debe solicitar que dedicated-unit-large-cohere-count aumente en 2.

  • Para alojar un modelo Cohere Command R+ 08-2024, debe solicitar dedicated-unit-large-cohere-count para aumentar en 2.

Referencias: Límites de servicio para la IA generativa y Solicitud de aumento del límite de cluster

Para la generación de texto, el resumen y los modelos de incrustación de texto, consulte las tablas de Coincidencia de modelos base con clusters.

Ejemplo 1 de alojamiento de un modelo básico

John desea alojar una instancia del modelo Command R+ 08-2024 (cohere.command-r-plus-08-2024) en una infraestructura dedicada. John suprime el cluster después de 40 días y desea conocer el costo del cluster. Para alojar un modelo cohere.command-r-plus-08-2024, John primero debe identificar el tamaño de unidad que puede alojar el modelo cohere.command-r-plus-08-2024. El tamaño de unidad para el modelo cohere.command-r-plus-08-2024 es una unidad Large Cohere V2_2. Consulte coincidencia de modelos base con clusters.

John necesita un mínimo de una unidad Large Cohere V2_2 para alojar el modelo cohere.command-r-plus-08-2024. Estos son los pasos para calcular el costo de un cluster de alojamiento con una unidad Large Cohere V2_2.

  1. Calcule las horas unitarias durante 40 días.
    40 days x 24 hours per day x 1 unit = 960 unit hours.
  2. Asegúrese de que las horas de unidad superen el compromiso mínimo para alojar los modelos.
    960 unit hours > 744 minimum unit hours
  3. Vaya a Precios de IA y, en OCI Generative AI, para Oracle Cloud Infrastructure Generative AI- Large Cohere - Dedicated, busque <Large-Cohere-dedicated-unit-per-hour-price>.
  4. En la página coincidencia de modelos base con clusters, busque el multiplicador para el modelo cohere.command-r-plus-08-2024:
    For Hosting, Multiply the Unit Price: x 2
  5. Calcule el precio por 40 días.
    price = (960 unit hours) x $<Large-Cohere-dedicated-unit-per-hour-price> x 2

Ejemplo 2 de alojamiento de un modelo básico

Alice desea alojar una instancia del modelo Command R 08-2024 (cohere.command-r-08-2024) en una infraestructura dedicada. Para alojar un modelo cohere.command-r-08-2024, Alice primero debe identificar el tamaño de unidad que puede alojar el modelo Command R 08-2024. El tamaño de la unidad para Command R 08-2024 es una unidad Small Cohere V2. Consulte coincidencia de modelos base con clusters.

Alice decide comprar tres unidades de Small Cohere V2 para gestionar un volumen de llamadas al modelo superior al que proporcionaría una sola unidad. Alice planea suprimir el cluster después de cinco días. Estos son los pasos para calcular el costo de un cluster de alojamiento con tres unidades Small Cohere V2 durante cinco días.

  1. Calcule las horas unitarias.
    5 days x 24 hours per day x 3 units = 360 unit hours. 
  2. Compare las horas de unidad con el compromiso mínimo para alojar los modelos.
    360 unit hours < 744 minimum unit hours
    Alice is charged for 744 unit hours.
  3. Vaya a Precios de IA y, en OCI Generative AI, para Oracle Cloud Infrastructure Generative AI- Small Cohere - Dedicated, busque <Small-Cohere-dedicated-unit-per-hour-price>.
  4. En la página coincidencia de modelos base con clusters, busque el multiplicador para el modelo cohere.command-r-08-2024.

    No es necesario multiplicar el precio para alojar el modelo cohere.command-r-08-2024.

  5. Calcule el costo para cinco días.
    price = (744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>

Ejemplo de ajuste y alojamiento de un modelo

Bob desea ajustar un modelo Command R 08-2024 (cohere.command-r-08-2024). Bob crea un cluster de IA dedicado a ajuste fino con el valor predefinido de ocho unidades Small Cohere V2. Bob crea un modelo personalizado en el cluster de IA fine-tuning Dedicated y ajusta el modelo básico Command R 08-2024 con datos de entrenamiento. El trabajo de ajuste fino tarda 5 horas en completarse. Bob crea un cluster de ajuste fino cada semana.

Para alojar un modelo cohere.command-r-08-2024, Bob necesita identificar el tamaño de unidad que puede alojar el modelo cohere.command-r-08-2024. El tamaño de unidad para el modelo cohere.command-r-08-2024 es una unidad Small Cohere V2. Consulte coincidencia de modelos base con clusters. Bob puede alojar hasta 50 modelos ajustados en un único cluster de alojamiento. Estos son los pasos para calcular el costo mensual para ajustar y alojar los modelos.

  1. Calcule las horas unitarias de cada ajuste.
    Each fine-tuning cluster requires 8 units and each cluster is active for 5 hours
    fine-tuning per cluster = 40 unit-hours
  2. Compare las horas unitarias con el compromiso mínimo para ajustar los modelos.
    40 unit hours > 1 unit hour
  3. Calcule las horas unitarias para el alojamiento.
    31 days x 24 hours per day x 1 unit = 744 unit hours
  4. Compare las horas de unidad con el compromiso mínimo para alojar los modelos.
    744 unit hours = 744 minimum unit hours
  5. Vaya a Precios de IA y, en OCI Generative AI, para Oracle Cloud Infrastructure Generative AI- Small Cohere - Dedicated, busque <Small-Cohere-dedicated-unit-per-hour-price>.
  6. Encuentre el precio mensual total.
    fine-tuning price = (40 unit hours) per week x (4 weeks) x $<Small-Cohere-dedicated-unit-per-hour-price> 
                                
    fine-tuning price = 160 x <Small-Cohere-dedicated-unit-per-hour-price>
    hosting price = (744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>
    total monthly price = (160 + 744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>
Consejo

Además de calcular el precio, puede estimar el costo seleccionando la categoría IA y aprendizaje automático y cargando el estimador de costos para OCI Generative AI.