Pago por clusters de IA dedicados

Los clústeres de IA dedicados en OCI Generative AI proporcionan precios predecibles y capacidad dedicada para ajustar y alojar modelos.

Para los modelos preentrenados de OCI Generative AI, se aplican los siguientes compromisos mínimos:

Clústeres de alojamiento: compromiso mínimo de 744 horas-unidad por cluster de alojamiento.
Ajuste de clusters: compromiso mínimo de 1 unidad de hora por trabajo de ajuste. Algunos modelos requieren al menos 2 unidades para el ajuste.

Nota

Los modelos importados no requieren el compromiso de alojamiento de 744 horas unitarias. Si crea un cluster de IA dedicado para alojar un modelo importado, puede alojar el modelo sin comprometerse con el compromiso de alojamiento mínimo que se aplica a los modelos previamente entrenados y ajustados de OCI Generative AI.

Los siguientes ejemplos muestran cómo calcular los costos de clúster de IA dedicada en OCI Generative AI. Para conocer los costos de inferencia bajo demanda, consulte Pago por inferencia bajo demanda.

Modelos de coincidencia con precios unitarios de cluster dedicados

Si está alojando modelos fundamentales o ajustándolos en clusters de IA dedicados, se le cobrará por la hora de unidad en lugar de por la transacción.

Vaya a la página modelos entrenados previamente y seleccione el modelo con el que desea trabajar. En la sección Cluster de AI dedicado para el modelo, busque el tamaño de unidad para el cluster de AI dedicado que coincida con el modelo y la información de página de precios. A continuación, revise los ejemplos de esta sección para aprender a calcular el costo para el uso de estos modelos.

Importante

Algunos modelos base preentrenados fundamentales de OCI Generative AI soportados para el modo de servicio dedicado ahora están en desuso y se retirarán antes de que transcurran 6 meses desde el lanzamiento del 1^er modelo de reemplazo. Puede alojar un modelo base o ajustar un modelo base y alojar el modelo ajustado en un cluster de IA dedicado (modo de servicio dedicado) hasta que el modelo base se retiró. Para conocer las fechas de baja del modo de servicio dedicado, consulte Baja de los modelos.

Ejemplo 1 de alojamiento de un modelo básico

John desea alojar una instancia del modelo Command R+ 08-2024 (cohere.command-r-plus-08-2024) en una infraestructura dedicada. John suprime el cluster después de 40 días y desea conocer el costo del cluster. Para alojar un modelo cohere.command-r-plus-08-2024, John primero debe identificar el tamaño de unidad que puede alojar el modelo cohere.command-r-plus-08-2024. El tamaño de unidad para el modelo cohere.command-r-plus-08-2024 es una unidad Large Cohere V2_2. Consulte Dedicated AI Cluster for the Model.

John necesita un mínimo de una unidad Large Cohere V2_2 para alojar el modelo cohere.command-r-plus-08-2024. Estos son los pasos para calcular el costo de un cluster de alojamiento con una unidad Large Cohere V2_2.

Calcule las horas unitarias durante 40 días.

40 days x 24 hours per day x 1 unit = 960 unit hours.

Asegúrese de que las horas unitarias superen el compromiso mínimo para alojar los modelos.
```
960 unit hours > 744 minimum unit hours
```
Vaya a Precios de IA y, en OCI Generative AI, para Oracle Cloud Infrastructure Generative AI- Large Cohere - Dedicated, busque <Large-Cohere-dedicated-unit-per-hour-price>.
En la sección de cluster de IA dedicado de la sección Cluster de IA dedicado para el modelo, busque el multiplicador para el modelo cohere.command-r-plus-08-2024:
```
                                For Hosting, Multiply the Unit Price: x 2
```

Calcule el precio durante 40 días.

price = (960 unit hours) x $<Large-Cohere-dedicated-unit-per-hour-price> x 2

Ejemplo 2 de alojamiento de un modelo básico

Alice desea alojar una instancia del modelo Command R 08-2024 (cohere.command-r-08-2024) en una infraestructura dedicada. Para alojar un modelo cohere.command-r-08-2024, Alice primero debe identificar el tamaño de unidad que puede alojar el modelo Command R 08-2024. El tamaño de la unidad para Command R 08-2024 es una unidad Small Cohere V2. Consulte Dedicated AI Cluster for the Model.

Alice decide comprar tres unidades de Small Cohere V2 para manejar un mayor volumen de llamadas al modelo de lo que proporcionaría una sola unidad. Alice planea suprimir el cluster después de cinco días. A continuación, se muestran los pasos para calcular el costo de un cluster de alojamiento con tres unidades Small Cohere V2 durante cinco días.

Calcule las horas unitarias.

5 days x 24 hours per day x 3 units = 360 unit hours.

Compare las horas unitarias con el compromiso mínimo para alojar los modelos.
```
360 unit hours < 744 minimum unit hours
Alice is charged for 744 unit hours.
```
Vaya a Precios de IA y, en OCI Generative AI, para Oracle Cloud Infrastructure Generative AI- Small Cohere - Dedicated, busque <Small-Cohere-dedicated-unit-per-hour-price>.
En la sección Cluster de IA dedicado para el modelo, busque el multiplicador para el modelo cohere.command-r-08-2024.

No es necesario multiplicar el precio por alojar el modelo cohere.command-r-08-2024.

Calcule el costo durante cinco días.

price = (744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>

Ejemplo de ajuste y alojamiento de un modelo

Bob desea ajustar un modelo Command R 08-2024 (cohere.command-r-08-2024). Bob crea un cluster de AI fine-tuning Dedicated con el valor predefinido de ocho unidades Small Cohere V2. Bob crea un modelo personalizado en el cluster de IA de ajuste dedicado y ajusta el modelo básico Command R 08-2024 con datos de entrenamiento. El trabajo de ajuste tarda 5 horas en completarse. Bob crea un cluster de ajuste cada semana.

Para alojar un modelo cohere.command-r-08-2024, Bob necesita identificar el tamaño de unidad que puede alojar el modelo cohere.command-r-08-2024. El tamaño de unidad para el modelo cohere.command-r-08-2024 es una unidad Small Cohere V2. Consulte Dedicated AI Cluster for the Model. Bob puede alojar hasta 50 modelos ajustados en un único cluster de alojamiento. Estos son los pasos para calcular el costo mensual para ajustar y alojar los modelos.

Calcule las horas unitarias para cada ajuste.

Each fine-tuning cluster requires 8 units and each cluster is active for 5 hours
fine-tuning per cluster = 40 unit-hours

Compare las horas unitarias con el compromiso mínimo para ajustar los modelos.
```
40 unit hours > 1 unit hour
```

Calcule las horas unitarias para el alojamiento.

31 days x 24 hours per day x 1 unit = 744 unit hours

Compare las horas unitarias con el compromiso mínimo para alojar los modelos.
```
744 unit hours = 744 minimum unit hours
```
Vaya a Precios de IA y, en OCI Generative AI, para Oracle Cloud Infrastructure Generative AI- Small Cohere - Dedicated, busque <Small-Cohere-dedicated-unit-per-hour-price>.

Encuentre el precio mensual total.

fine-tuning price = (40 unit hours) per week x (4 weeks) x $<Small-Cohere-dedicated-unit-per-hour-price> 
                            
fine-tuning price = 160 x <Small-Cohere-dedicated-unit-per-hour-price>

hosting price = (744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>

total monthly price = (160 + 744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>

Consejo

Además de calcular el precio, puede estimar el costo seleccionando la categoría IA y Machine Learning y cargando el estimador de costos para OCI Generative AI.

Documentación de Oracle Cloud Infrastructure

Pago por clusters de IA dedicados

Modelos de coincidencia con precios unitarios de cluster dedicados

Ejemplo 1 de alojamiento de un modelo básico

Ejemplo 2 de alojamiento de un modelo básico

Ejemplo de ajuste y alojamiento de un modelo