Méta-modèles pris en charge
Vous pouvez importer des modèles de langage volumineux à partir de buckets Hugging Face et OCI Object Storage dans OCI Generative AI, créer des adresses pour ces modèles et les utiliser dans le service d'IA générative.
Ces modèles sont une version améliorée des modèles Meta Llama avec Grouped Query Attention (GQA). Pour plus d'informations, reportez-vous aux documents Llama 2, Llama 3, Llama 3.1, Llama 3.2, Llama 3.3, Llama 4 dans la documentation Hugging Face.
Meta Llama
Remarque
- Pour importer une version affinée d'un modèle, seuls les modèles affinés qui utilisent la même version des transformateurs que le modèle d'origine et dont le nombre de paramètres est inférieur à ±10 % de celui de l'original sont pris en charge.
- Si le type d'instance de la forme d'unité recommandée n'est pas disponible dans votre région, sélectionnez une instance de niveau supérieur (par exemple, sélectionnez une forme H100 au lieu d'une forme A100-80G).
- Pour connaître les prérequis et savoir comment importer des modèles, reportez-vous à Gestion des modèles importés (nouveau).