Paiement pour les clusters d'IA dédiés

Les clusters d'IA dédiés dans OCI Generative AI fournissent une tarification prévisible et une capacité dédiée pour affiner et héberger les modèles.

Pour les modèles préentraînés OCI Generative AI, les engagements minimum suivants s'appliquent :

Clusters d'hébergement : engagement minimal de 744 heures par unité par cluster d'hébergement.
Clusters à réglage fin : engagement minimal de 1 unité-heure par travail de réglage fin. Certains modèles nécessitent au moins 2 unités pour le réglage fin.

Remarque

Les modèles importés ne nécessitent pas l'engagement d'hébergement de 744 unités/heure. Si vous créez un cluster d'IA dédié pour héberger un modèle importé, vous pouvez héberger le modèle sans vous engager à respecter l'engagement d'hébergement minimal qui s'applique aux modèles préentraînés et affinés OCI Generative AI.

Les exemples suivants montrent comment calculer les coûts de cluster d'IA dédié dans OCI Generative AI. Pour connaître les coûts d'inférence à la demande, voir Paiement pour l'inférence à la demande.

Mise en correspondance des modèles avec les prix unitaires de cluster dédiés

Si vous hébergez des modèles fondamentaux ou que vous les affinez sur des clusters d'IA dédiés, vous êtes facturé par heure d'unité plutôt que par transaction.

Accédez à la page Modèles préentraînés et sélectionnez le modèle que vous souhaitez utiliser. Dans la section Cluster d'IA dédié pour le modèle, recherchez la taille d'unité du cluster d'IA dédié qui correspond au modèle et les informations sur la page de tarification. Consultez ensuite les exemples de cette section pour savoir comment calculer le coût d'utilisation de ces modèles.

Important

Certains modèles de base préentraînés fondamentaux d'OCI Generative AI pris en charge pour le mode de service dédié sont désormais en phase d'abandon et seront mis hors service au plus tôt 6 mois après la publication du 1^er modèle de remplacement. Vous pouvez héberger un modèle de base ou affiner un modèle de base et héberger le modèle affiné sur un cluster d'IA dédié (mode de service dédié) jusqu'à ce que le modèle de base soit retraité. Pour connaître les dates de retrait du mode de service dédié, voir Mise hors service des modèles.

Hébergement d'un modèle de base - Exemple 1

John souhaite héberger une instance du modèle Command R+ 08-2024 (cohere.command-r-plus-08-2024) sur une infrastructure dédiée. John supprime le cluster après 40 jours et souhaite connaître le coût du cluster. Pour héberger un modèle cohere.command-r-plus-08-2024, John doit d'abord identifier la taille d'unité pouvant héberger le modèle cohere.command-r-plus-08-2024. La taille d'unité du modèle cohere.command-r-plus-08-2024 est une unité Large Cohere V2_2. Reportez-vous à Cluster d'IA dédié pour le modèle.

John a besoin d'au moins une unité Large Cohere V2_2 pour héberger le modèle cohere.command-r-plus-08-2024. Voici les étapes à suivre pour calculer le coût d'un cluster d'hébergement avec une unité Large Cohere V2_2.

Calculer les heures unitaires pendant 40 jours.

40 days x 24 hours per day x 1 unit = 960 unit hours.

Assurez-vous que les heures unitaires dépassent l'engagement minimum pour l'hébergement des modèles.
```
960 unit hours > 744 minimum unit hours
```
Accédez à la tarification de l'IA et sous OCI Generative AI, pour Oracle Cloud Infrastructure Generative AI- Large Cohere - Dedicated, recherchez le site <Large-Cohere-dedicated-unit-per-hour-price>.
Dans la section de cluster d'IA dédié de la section Cluster d'IA dédié pour le modèle, recherchez le multiplicateur pour le modèle cohere.command-r-plus-08-2024 :
```
                                For Hosting, Multiply the Unit Price: x 2
```

Calculez le prix pendant 40 jours.

price = (960 unit hours) x $<Large-Cohere-dedicated-unit-per-hour-price> x 2

Hébergement d'un modèle de base - Exemple 2

Alice souhaite héberger une instance du modèle Command R 08-2024 (cohere.command-r-08-2024) sur une infrastructure dédiée. Pour héberger un modèle cohere.command-r-08-2024, Alice doit d'abord identifier la taille d'unité pouvant héberger le modèle Command R 08-2024. La taille d'unité pour Command R 08-2024 est une unité Small Cohere V2. Reportez-vous à Cluster d'IA dédié pour le modèle.

Alice décide d'acheter trois unités de Small Cohere V2 pour gérer un volume d'appels au modèle supérieur à celui fourni par une seule unité. Alice prévoit de supprimer le cluster au bout de cinq jours. Voici les étapes à suivre pour calculer le coût d'un cluster d'hébergement avec trois unités Small Cohere V2 pendant cinq jours.

Calculer les heures unitaires.

5 days x 24 hours per day x 3 units = 360 unit hours.

Comparez les heures d'unité à l'engagement minimum pour l'hébergement des modèles.
```
360 unit hours < 744 minimum unit hours
Alice is charged for 744 unit hours.
```
Accédez à la tarification de l'IA et sous OCI Generative AI, pour Oracle Cloud Infrastructure Generative AI- Small Cohere - Dedicated, recherchez le site <Small-Cohere-dedicated-unit-per-hour-price>.
Dans la section Cluster d'IA dédié pour le modèle, recherchez le multiplicateur pour le modèle cohere.command-r-08-2024.

Vous n'avez pas besoin de multiplier le prix d'hébergement du modèle cohere.command-r-08-2024.

Calculez le coût pendant cinq jours.

price = (744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>

Affinage et hébergement d'un modèle - Exemple

Bob souhaite affiner un modèle Command R 08-2024 (cohere.command-r-08-2024). Bob crée un cluster d'IA de réglage fin dédié avec la valeur prédéfinie de huit unités Small Cohere V2. Bob crée un modèle personnalisé sur le cluster d'IA de réglage fin dédié et affine le modèle de base Command R 08-2024 avec des données d'entraînement. Le travail de réglage fin prend 5 heures. Bob crée un cluster de réglage fin chaque semaine.

Pour héberger un modèle cohere.command-r-08-2024, Bob doit identifier la taille d'unité pouvant héberger le modèle cohere.command-r-08-2024. La taille d'unité du modèle cohere.command-r-08-2024 est une unité Small Cohere V2. Reportez-vous à Cluster d'IA dédié pour le modèle. Bob peut héberger jusqu'à 50 modèles affinés sur un seul cluster d'hébergement. Voici les étapes à suivre pour calculer le coût mensuel d'affinage et d'hébergement des modèles.

Calculez les heures unitaires pour chaque réglage fin.

Each fine-tuning cluster requires 8 units and each cluster is active for 5 hours
fine-tuning per cluster = 40 unit-hours

Comparez les heures unitaires à l'engagement minimum pour affiner les modèles.
```
40 unit hours > 1 unit hour
```

Calculez les heures unitaires pour l'hébergement.

31 days x 24 hours per day x 1 unit = 744 unit hours

Comparez les heures d'unité à l'engagement minimum pour l'hébergement des modèles.
```
744 unit hours = 744 minimum unit hours
```
Accédez à la tarification de l'IA et sous OCI Generative AI, pour Oracle Cloud Infrastructure Generative AI- Small Cohere - Dedicated, recherchez le site <Small-Cohere-dedicated-unit-per-hour-price>.

Trouvez le prix mensuel total.

fine-tuning price = (40 unit hours) per week x (4 weeks) x $<Small-Cohere-dedicated-unit-per-hour-price> 
                            
fine-tuning price = 160 x <Small-Cohere-dedicated-unit-per-hour-price>

hosting price = (744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>

total monthly price = (160 + 744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>

Conseil

Outre le calcul du prix, vous pouvez estimer le coût en sélectionnant la catégorie IA et apprentissage automatique et en chargeant l'évaluateur de coûts pour OCI Generative AI.

Documentation Oracle Cloud Infrastructure

Paiement pour les clusters d'IA dédiés

Mise en correspondance des modèles avec les prix unitaires de cluster dédiés

Hébergement d'un modèle de base - Exemple 1

Hébergement d'un modèle de base - Exemple 2

Affinage et hébergement d'un modèle - Exemple