Gestion des modèles importés (Nouveau)
En plus d'utiliser les modèles préentraînés hébergés dans le service d'intelligence artificielle générative pour OCI, vous pouvez importer des modèles à code source libre et de tierce partie pris en charge (par exemple, depuis Hugging Face) dans le service d'intelligence artificielle générative pour OCI, les héberger, créer des points d'extrémité et les utiliser comme tout autre modèle.
Conditions requises pour l'obtention d'un visage
Avant d'importer un modèle directement depuis Hugging Face :
- Décidez quel modèle pris en charge à partir de Hugging Face pour importer et noter sa taille d'unité de grappe dédiée à l'IA recommandée.
- Pour accéder et utiliser certains modèles, vous avez besoin d'un jeton Hugging Face, en particulier les versions plus récentes et fermées telles que Llama 3 et Llama 3.1 Pour ces modèles, générez un jeton d'accès à partir des paramètres de votre compte Hugging Face sous Jetons d'accès. Assurez-vous qu'il dispose des autorisations nécessaires (au moins l'accès "lecture").
Préalables pour le stockage d'objets
Avant d'importer un modèle à partir d'un seau de stockage d'objets :
- Si vous n'êtes pas un administrateur OCI, demandez à un administrateur de vous accorder l'autorisation IAM pour gérer le stockage d'objets dans votre compartiment :
allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket> - Choisissez un modèle qui fonctionne avec le point d'extrémité
/v1/chat/completions. Seuls ces modèles sont pris en charge. - Assurez-vous que le modèle ne prend en charge qu'une des fonctions suivantes :
- TEXT_TO_TEXT : texte in, texte out
- IMAGE_TEXT_TO_TEXT : image ou texte, ou les deux, texte sortant
- REGISTREMENT : texte en, plongements vectoriels en sortie
- RERANK : interrogation et documents de candidat, notes de pertinence et liste reclassée
- Enregistrez les artefacts de modèle dans un seau de stockage d'objets.
- Important : Le fichier de configuration doit être nommé
config.jsonpour que l'importation soit réussie, comme pour la plupart des modèles Hugging Face.
Demande de ressource et tarification
Pour atteindre un modèle importé, vous créez un point d'extrémité pour ce modèle sur une grappe dédiée à l'IA. Utilisez le tableau suivant pour demander des ressources de grappe dédiée à l'IA avant d'importer un modèle.
| Taille d'unité de grappe dédiée à l'IA | Nom de la limite | Unités requises de la demande | Nombre d'unités d'intelligence artificielle |
|---|---|---|---|
| A10_X1 | dedicated-unit-a10-count |
1 | 1,77 |
| A10_X2 | dedicated-unit-a10-count |
2 | 3,54 |
| A10_X4 | dedicated-unit-a10-count |
4 | 7,08 |
| A100_40G_X1 | dedicated-unit-a100-40g-count |
1 | 2,7 |
| A100_40G_X2 | dedicated-unit-a100-40g-count |
2 | 5,4 |
| A100_40G_X4 | dedicated-unit-a100-40g-count |
4 | 10,8 |
| A100_40G_X8 | dedicated-unit-a100-40g-count |
8 | 21,6 |
| A100_80G_X1 | dedicated-unit-a100-80g-count |
1 | 3,24 |
| A100_80G_X2 | dedicated-unit-a100-80g-count |
2 | 6,48 |
| A100_80G_X4 | dedicated-unit-a100-80g-count |
4 | 12,96 |
| A100_80G_X8 | dedicated-unit-a100-80g-count |
8 | 25,92 |
| H100_X1 | dedicated-unit-h100-count |
1 | 6,01 |
| H100_X2 | dedicated-unit-h100-count |
2 | 12,02 |
| H100_X4 | dedicated-unit-h100-count |
4 | 24,04 |
| H100_X8 | dedicated-unit-h100-count |
8 | 48,08 |
| H200_X1 | dedicated-unit-h200-count |
1 | 6,22 |
| H200_X2 | dedicated-unit-h200-count |
2 | 12,44 |
| H200_X4 | dedicated-unit-h200-count |
4 | 24,88 |
| H200_X8 | dedicated-unit-h200-count |
8 | 49,76 |
Pour demander les ressources pour la taille d'unité de grappe dédiée à l'IA recommandée, voir Demande d'une limite de ressources.
Pour calculer le prix, multipliez le prix de l'unité d'intelligence artificielle par heure pour Oracle Cloud Infrastructure Generative AI - Importation de modèle dans la page Informations sur la page de tarification par le nombre d'unités d'intelligence artificielle dans cette page.
Tâches d'importation d'un modèle
- Importez le modèle à l'aide de l'une des options suivantes :
- Créez une grappe dédiée à l'IA hôte pour le modèle importé avec une forme d'unité recommandée.
- Créer un point d'extrémité.
- Appelez le modèle au moyen de l'API du service d'intelligence artificielle générative pour OCI, de la trousse SDK ou utilisez le modèle dans le terrain de jeu.
Gestion des modèles importés
Après avoir effectué les préalables et importé un modèle, vous pouvez effectuer les tâches suivantes sur les modèles importés :