Gestion des modèles importés (nouveau)
En plus d'utiliser les modèles préentraînés hébergés dans OCI Generative AI, vous pouvez importer des modèles open source et tiers pris en charge (par exemple, à partir de Hugging Face) dans OCI Generative AI, les héberger, créer des adresses et les utiliser comme tout autre modèle.
Prérequis pour l'inclusion de face
Avant d'importer un modèle directement à partir de Hugging Face :
- Choisissez le modèle pris en charge à partir de Hugging Face à importer et notez la taille d'unité de cluster d'IA dédié recommandée.
- Pour accéder à certains modèles et les utiliser, vous avez besoin d'un jeton Hugging Face, en particulier les versions plus récentes et fermées telles que Llama 3 et Llama 3.1. Pour ces modèles, générez un jeton d'accès à partir des paramètres de votre compte Hugging Face sous Jetons d'accès. Assurez-vous qu'il dispose des droits d'accès nécessaires (au moins "lecture").
Prérequis pour Object Storage
Avant d'importer un modèle à partir d'un bucket Object Storage, procédez comme suit :
- Si vous n'êtes pas un administrateur OCI, demandez-lui de vous accorder le droit d'accès IAM pour gérer Object Storage dans votre compartiment :
allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket> - Choisissez un modèle qui fonctionne avec l'adresse
/v1/chat/completions. Seuls ces modèles sont pris en charge. - Assurez-vous que le modèle ne prend en charge qu'une seule des fonctionnalités suivantes :
- TEXT_TO_TEXT : texte entrant, texte sortant
- IMAGE_TEXT_TO_TEXT : image ou texte, ou les deux, texte sortant
- EMBEDING : texte entrant, incorporations vectorielles sortantes
- RERANK : recherche et documents de candidat, scores de pertinence et liste réorganisée
- Enregistrez les artefacts de modèle dans un bucket Object Storage.
- Important : le fichier de configuration doit être appelé
config.jsonpour que l'import réussisse, comme la plupart des modèles Hugging Face.
Demande de ressource et tarification
Pour atteindre un modèle importé, vous créez une adresse pour ce modèle sur un cluster d'IA dédié. Utilisez le tableau suivant pour demander des ressources de cluster AI dédiées avant d'importer un modèle.
| Taille d'unité de cluster d'IA dédié | Nom de la limite | Demander des unités requises | Nombre d'unités AI |
|---|---|---|---|
| A10_X1 | dedicated-unit-a10-count |
1 | 1,77 |
| A10_X2 | dedicated-unit-a10-count |
2 | 3,54 |
| A10_X4 | dedicated-unit-a10-count |
4 | 7,08 |
| A100_40G_X1 | dedicated-unit-a100-40g-count |
1 | 2,7 |
| A100_40G_X2 | dedicated-unit-a100-40g-count |
2 | 5,4 |
| A100_40G_X4 | dedicated-unit-a100-40g-count |
4 | 10,8 |
| A100_40G_X8 | dedicated-unit-a100-40g-count |
8 | 21,6 |
| A100_80G_X1 | dedicated-unit-a100-80g-count |
1 | 3,24 |
| A100_80G_X2 | dedicated-unit-a100-80g-count |
2 | 6,48 |
| A100_80G_X4 | dedicated-unit-a100-80g-count |
4 | 12,96 |
| A100_80G_X8 | dedicated-unit-a100-80g-count |
8 | 25,92 |
| H100_X1 | dedicated-unit-h100-count |
1 | 6,01 |
| H100_X2 | dedicated-unit-h100-count |
2 | 12,02 |
| H100_X4 | dedicated-unit-h100-count |
4 | 24,04 |
| H100_X8 | dedicated-unit-h100-count |
8 | 48,08 |
| H200_X1 | dedicated-unit-h200-count |
1 | 6,22 |
| H200_X2 | dedicated-unit-h200-count |
2 | 12,44 |
| H200_X4 | dedicated-unit-h200-count |
4 | 24,88 |
| H200_X8 | dedicated-unit-h200-count |
8 | 49,76 |
Pour demander les ressources pour la taille d'unité de cluster d'IA dédié recommandée, reportez-vous à Demande d'une limite de ressources.
Pour calculer le prix, multipliez le prix de l'unité d'IA par heure pour Oracle Cloud Infrastructure Generative AI - Import de modèle sur la page Informations sur la page Tarification par le nombre d'unités d'IA sur cette page.
Tâches d'import d'un modèle
- Importez le modèle à l'aide de l'une des options suivantes :
- Créez un cluster d'IA dédié d'hébergement pour le modèle importé avec une forme d'unité recommandée.
- Création d'une adresse.
- Appelez le modèle via l'API OCI Generative AI, le kit SDK ou utilisez le modèle dans le terrain de jeu.
Gestion des modèles importés
Après avoir effectué les prérequis et importé un modèle, vous pouvez effectuer les tâches suivantes sur les modèles importés :