Gestion des modèles importés (Nouveau)

En plus d'utiliser les modèles préentraînés hébergés dans le service d'intelligence artificielle générative pour OCI, vous pouvez importer des modèles à code source libre et de tierce partie pris en charge (par exemple, depuis Hugging Face) dans le service d'intelligence artificielle générative pour OCI, les héberger, créer des points d'extrémité et les utiliser comme tout autre modèle.

Conditions requises pour l'obtention d'un visage

Avant d'importer un modèle directement depuis Hugging Face :

  • Décidez quel modèle pris en charge à partir de Hugging Face pour importer et noter sa taille d'unité de grappe dédiée à l'IA recommandée.
  • Pour accéder et utiliser certains modèles, vous avez besoin d'un jeton Hugging Face, en particulier les versions plus récentes et fermées telles que Llama 3 et Llama 3.1 Pour ces modèles, générez un jeton d'accès à partir des paramètres de votre compte Hugging Face sous Jetons d'accès. Assurez-vous qu'il dispose des autorisations nécessaires (au moins l'accès "lecture").

Préalables pour le stockage d'objets

Avant d'importer un modèle à partir d'un seau de stockage d'objets :

  • Si vous n'êtes pas un administrateur OCI, demandez à un administrateur de vous accorder l'autorisation IAM pour gérer le stockage d'objets dans votre compartiment :
    allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket>
                                
  • Choisissez un modèle qui fonctionne avec le point d'extrémité /v1/chat/completions. Seuls ces modèles sont pris en charge.
  • Assurez-vous que le modèle ne prend en charge qu'une des fonctions suivantes :
    • TEXT_TO_TEXT : texte in, texte out
    • IMAGE_TEXT_TO_TEXT : image ou texte, ou les deux, texte sortant
    • REGISTREMENT : texte en, plongements vectoriels en sortie
    • RERANK : interrogation et documents de candidat, notes de pertinence et liste reclassée
  • Enregistrez les artefacts de modèle dans un seau de stockage d'objets.
  • Important : Le fichier de configuration doit être nommé config.json pour que l'importation soit réussie, comme pour la plupart des modèles Hugging Face.

Demande de ressource et tarification

Pour atteindre un modèle importé, vous créez un point d'extrémité pour ce modèle sur une grappe dédiée à l'IA. Utilisez le tableau suivant pour demander des ressources de grappe dédiée à l'IA avant d'importer un modèle.

Tailles d'unité de grappe dédiées à l'IA pour les modèles importés
Taille d'unité de grappe dédiée à l'IA Nom de la limite Unités requises de la demande Nombre d'unités d'intelligence artificielle
A10_X1 dedicated-unit-a10-count 1 1,77
A10_X2 dedicated-unit-a10-count 2 3,54
A10_X4 dedicated-unit-a10-count 4 7,08
A100_40G_X1 dedicated-unit-a100-40g-count 1 2,7
A100_40G_X2 dedicated-unit-a100-40g-count 2 5,4
A100_40G_X4 dedicated-unit-a100-40g-count 4 10,8
A100_40G_X8 dedicated-unit-a100-40g-count 8 21,6
A100_80G_X1 dedicated-unit-a100-80g-count 1 3,24
A100_80G_X2 dedicated-unit-a100-80g-count 2 6,48
A100_80G_X4 dedicated-unit-a100-80g-count 4 12,96
A100_80G_X8 dedicated-unit-a100-80g-count 8 25,92
H100_X1 dedicated-unit-h100-count 1 6,01
H100_X2 dedicated-unit-h100-count 2 12,02
H100_X4 dedicated-unit-h100-count 4 24,04
H100_X8 dedicated-unit-h100-count 8 48,08
H200_X1 dedicated-unit-h200-count 1 6,22
H200_X2 dedicated-unit-h200-count 2 12,44
H200_X4 dedicated-unit-h200-count 4 24,88
H200_X8 dedicated-unit-h200-count 8 49,76
Conseil

Pour demander les ressources pour la taille d'unité de grappe dédiée à l'IA recommandée, voir Demande d'une limite de ressources.

Pour calculer le prix, multipliez le prix de l'unité d'intelligence artificielle par heure pour Oracle Cloud Infrastructure Generative AI - Importation de modèle dans la page Informations sur la page de tarification par le nombre d'unités d'intelligence artificielle dans cette page.