Gestion des modèles importés (nouveau)

En plus d'utiliser les modèles préentraînés hébergés dans OCI Generative AI, vous pouvez importer des modèles open source et tiers pris en charge (par exemple, à partir de Hugging Face) dans OCI Generative AI, les héberger, créer des adresses et les utiliser comme tout autre modèle.

Prérequis pour l'inclusion de face

Avant d'importer un modèle directement à partir de Hugging Face :

  • Choisissez le modèle pris en charge à partir de Hugging Face à importer et notez la taille d'unité de cluster d'IA dédié recommandée.
  • Pour accéder à certains modèles et les utiliser, vous avez besoin d'un jeton Hugging Face, en particulier les versions plus récentes et fermées telles que Llama 3 et Llama 3.1. Pour ces modèles, générez un jeton d'accès à partir des paramètres de votre compte Hugging Face sous Jetons d'accès. Assurez-vous qu'il dispose des droits d'accès nécessaires (au moins "lecture").

Prérequis pour Object Storage

Avant d'importer un modèle à partir d'un bucket Object Storage, procédez comme suit :

  • Si vous n'êtes pas un administrateur OCI, demandez-lui de vous accorder le droit d'accès IAM pour gérer Object Storage dans votre compartiment :
    allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket>
                                
  • Choisissez un modèle qui fonctionne avec l'adresse /v1/chat/completions. Seuls ces modèles sont pris en charge.
  • Assurez-vous que le modèle ne prend en charge qu'une seule des fonctionnalités suivantes :
    • TEXT_TO_TEXT : texte entrant, texte sortant
    • IMAGE_TEXT_TO_TEXT : image ou texte, ou les deux, texte sortant
    • EMBEDING : texte entrant, incorporations vectorielles sortantes
    • RERANK : recherche et documents de candidat, scores de pertinence et liste réorganisée
  • Enregistrez les artefacts de modèle dans un bucket Object Storage.
  • Important : le fichier de configuration doit être appelé config.json pour que l'import réussisse, comme la plupart des modèles Hugging Face.

Demande de ressource et tarification

Pour atteindre un modèle importé, vous créez une adresse pour ce modèle sur un cluster d'IA dédié. Utilisez le tableau suivant pour demander des ressources de cluster AI dédiées avant d'importer un modèle.

Tailles des unités de cluster d'IA dédiées pour les modèles importés
Taille d'unité de cluster d'IA dédié Nom de la limite Demander des unités requises Nombre d'unités AI
A10_X1 dedicated-unit-a10-count 1 1,77
A10_X2 dedicated-unit-a10-count 2 3,54
A10_X4 dedicated-unit-a10-count 4 7,08
A100_40G_X1 dedicated-unit-a100-40g-count 1 2,7
A100_40G_X2 dedicated-unit-a100-40g-count 2 5,4
A100_40G_X4 dedicated-unit-a100-40g-count 4 10,8
A100_40G_X8 dedicated-unit-a100-40g-count 8 21,6
A100_80G_X1 dedicated-unit-a100-80g-count 1 3,24
A100_80G_X2 dedicated-unit-a100-80g-count 2 6,48
A100_80G_X4 dedicated-unit-a100-80g-count 4 12,96
A100_80G_X8 dedicated-unit-a100-80g-count 8 25,92
H100_X1 dedicated-unit-h100-count 1 6,01
H100_X2 dedicated-unit-h100-count 2 12,02
H100_X4 dedicated-unit-h100-count 4 24,04
H100_X8 dedicated-unit-h100-count 8 48,08
H200_X1 dedicated-unit-h200-count 1 6,22
H200_X2 dedicated-unit-h200-count 2 12,44
H200_X4 dedicated-unit-h200-count 4 24,88
H200_X8 dedicated-unit-h200-count 8 49,76
Conseil

Pour demander les ressources pour la taille d'unité de cluster d'IA dédié recommandée, reportez-vous à Demande d'une limite de ressources.

Pour calculer le prix, multipliez le prix de l'unité d'IA par heure pour Oracle Cloud Infrastructure Generative AI - Import de modèle sur la page Informations sur la page Tarification par le nombre d'unités d'IA sur cette page.