Modèles Google pris en charge
Vous pouvez importer des modèles de langage volumineux à partir de buckets Hugging Face et OCI Object Storage dans OCI Generative AI, créer des adresses pour ces modèles et les utiliser dans le service d'IA générative.
Les séries Google Gemma, y compris les modèles open source Gemma2 et Gemma3, sont conçues pour répondre à des besoins de traitement de langage étendus et à une grande polyvalence. Pour plus d'informations, reportez-vous à Gemma2 et à Gemma3 dans la documentation Hugging Face.
Gemma
| Hugging Face Model - ID | Capacité du modèle | Forme d'unité de cluster d'IA dédiée recommandée |
|---|---|---|
| google/gemma-2-2b-it | TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-2-9b-it | TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-2-27b-it | TEXT_TO_TEXT | A100_80G_X2 |
| google/gemma-3-1b-it | TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-3-4b-it | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-3-12b-it | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-3-27b-it | IMAGE_TEXT_TO_TEXT | A100_80G_X2 |
| google/gemma-3-270m-it | TEXT_TO_TEXT | A100_80G_X1 |
Remarque
- Pour importer une version affinée d'un modèle, seuls les modèles affinés qui utilisent la même version des transformateurs que le modèle d'origine et dont le nombre de paramètres est inférieur à ±10 % de celui de l'original sont pris en charge.
- Si le type d'instance de la forme d'unité recommandée n'est pas disponible dans votre région, sélectionnez une instance de niveau supérieur (par exemple, sélectionnez une forme H100 au lieu d'une forme A100-80G).
- Pour connaître les prérequis et savoir comment importer des modèles, reportez-vous à Gestion des modèles importés (nouveau).