Paiement pour les grappes d'intelligence artificielle dédiées
Vous bénéficiez des avantages suivants pour l'utilisation de grappes d'IA dédiées dans le service d'intelligence artificielle générative pour OCI :
- Tarification prévisible qui ne fluctue pas avec la demande.
- Idéal pour le réglage fin ou l'hébergement de modèles.
- Engagement d'hébergement minimal : 744 unités-heures par grappe d'hébergement.
- Engagement minimum de réglage de précision : 1 unité d'heure par tâche de réglage de précision. (Selon le modèle, le réglage fin nécessite au moins 2 unités à exécuter).
Les exemples suivants calculent le coût de la grappe d'IA dédiée dans l'IA générative OCI. Pour calculer le coût d'inférence de sur demande, voir Paiement de l'inférence sur demande.
Mise en correspondance des modèles avec les prix unitaires des grappes dédiées
Si vous hébergez des modèles de base d'hébergement ou que vous les réglez sur des grappes d'IA dédiées, vous êtes facturé en heure d'unité plutôt qu'en transaction.
Allez à la page Modèles préentraînés et sélectionnez le modèle avec lequel vous voulez travailler. Dans la section Grappe dédiée à l'IA pour le modèle, recherchez la taille d'unité de la grappe dédiée à l'IA qui correspond au modèle et les informations sur la page de tarification. Ensuite, consultez les exemples de cette section pour savoir comment calculer le coût d'utilisation de ces modèles.
Certains modèles de base préentraînés de l'IA générative pour OCI pris en charge pour le mode de service dédié sont maintenant obsolètes et seront mis hors service au plus tôt 6 mois après la publication du 1er modèle de remplacement. Vous pouvez héberger un modèle de base ou ajuster un modèle de base et héberger le modèle ajusté sur une grappe dédiée à l'IA (mode de service dédié) jusqu'à ce que le modèle de base soit abandonné. Pour les dates de mise hors service du mode de service dédié, voir Mise hors service des modèles.
Hébergement d'un modèle de base - Exemple 1
John veut héberger une instance du modèle Command R+ 08-2024 (cohere.command-r-plus-08-2024) sur une infrastructure dédiée. John supprime le cluster après 40 jours et souhaite connaître le coût du cluster. Pour héberger un modèle cohere.command-r-plus-08-2024, John doit d'abord identifier la taille d'unité qui peut héberger le modèle cohere.command-r-plus-08-2024. La taille d'unité pour le modèle cohere.command-r-plus-08-2024 est une unité Large Cohere V2_2. Voir Grappe dédiée à l'IA pour le modèle.
John a besoin d'au moins une unité Large Cohere V2_2 pour héberger le modèle cohere.command-r-plus-08-2024. Voici les étapes pour calculer le coût d'une grappe d'hébergement avec une unité Large Cohere V2_2.
Hébergement d'un modèle de base - Exemple 2
Alice souhaite héberger une instance du modèle Command R 08-2024 (cohere.command-r-08-2024) sur une infrastructure dédiée. Pour héberger un modèle cohere.command-r-08-2024, Alice doit d'abord identifier la taille d'unité qui peut héberger le modèle Command R 08-2024. La taille d'unité pour Command R 08-2024 est une unité Small Cohere V2. Voir Grappe dédiée à l'IA pour le modèle.
Alice décide d'acheter trois unités de Small Cohere V2 pour gérer un volume d'appels au modèle supérieur à celui fourni par une seule unité. Alice prévoit de supprimer le cluster au bout de cinq jours. Voici les étapes pour calculer le coût d'une grappe d'hébergement avec trois unités Small Cohere V2 pendant cinq jours.
Exemple de réglage fin et d'hébergement d'un modèle
Bob veut affiner un modèle Command R 08-2024 (cohere.command-r-08-2024). Bob crée une grappe d'IA dédiée au réglage de précision avec la valeur prédéfinie de huit unités Small Cohere V2. Bob crée un modèle personnalisé sur la grappe d'intelligence artificielle dédiée au réglage de précision et affine le modèle de base Command R 08-2024 avec les données d'entraînement. La tâche de réglage fin prend 5 heures. Bob crée un cluster de réglage fin chaque semaine.
Pour héberger un modèle cohere.command-r-08-2024, Bob doit identifier la taille d'unité qui peut héberger le modèle cohere.command-r-08-2024. La taille d'unité pour le modèle cohere.command-r-08-2024 est une unité Small Cohere V2. Voir Grappe dédiée à l'IA pour le modèle. Bob peut héberger jusqu'à 50 modèles affinés sur un seul cluster d'hébergement. Voici les étapes à suivre pour calculer le coût mensuel du réglage et de l'hébergement des modèles.
En plus de calculer le prix, vous pouvez estimer le coût en sélectionnant la catégorie IA et apprentissage automatique et en chargeant l'estimateur de coûts pour OCI Generative AI.