Modèles Google validés

Vous pouvez importer des modèles de langage volumineux à partir de buckets Hugging Face et OCI Object Storage dans OCI Generative AI, créer des adresses pour ces modèles et les utiliser dans le service d'IA générative.

Les séries Google Gemma, y compris les modèles open source Gemma2 et Gemma3, sont conçues pour répondre à des besoins de traitement de langage étendus et à une grande polyvalence. Pour plus d'informations, reportez-vous à Gemma2 et à Gemma3 dans la documentation Hugging Face.

Gemma

Modèles Gemma validés
ID modèle Hugging Face Capacité du modèle Forme d'unité de cluster d'IA dédiée recommandée
google/gemma-3-4b-it IMAGE_TEXT_TO_TEXT A100_80G_X1
google/gemma-3-270m-it TEXT_TO_TEXT A100_80G_X1
google/gemma-3-27b-it IMAGE_TEXT_TO_TEXT A100_80G_X2
google/gemma-3-12b-it IMAGE_TEXT_TO_TEXT A100_80G_X1
google/gemma-3-1b-it TEXT_TO_TEXT A100_80G_X1
google/gemma-2-9b-it TEXT_TO_TEXT A100_80G_X1
google/gemma-2-27b-it TEXT_TO_TEXT A100_80G_X2
google/gemma-2-2b-it TEXT_TO_TEXT A100_80G_X1
Important

  • Bien que vous puissiez importer n'importe quel modèle de discussion, d'intégration (et de réglage fin) validé via Open Model Engine (avec exécution vLLM ou SGLang), seuls les modèles explicitement répertoriés sur cette page sont validés pour cette famille de modèles. Les modèles non répertoriés peuvent présenter des problèmes de compatibilité et nous vous recommandons de tester tous les modèles non répertoriés avant leur utilisation en production. Découvrez l'architecture de modèle importée d'OCI Generative AI.

  • Pour les modèles importés, vous pouvez utiliser la longueur de contexte native indiquée par le fournisseur de modèle. Cependant, la longueur de contexte maximale effective est limitée par la configuration matérielle sous-jacente que vous sélectionnez pour l'hébergement de clusters d'IA dédiés dans OCI Generative AI. Pour tirer pleinement parti de la longueur du contexte natif d'un modèle, vous devrez peut-être provisionner davantage de ressources matérielles.
  • Utilisez les modèles affinés uniquement s'ils correspondent à la version du transformateur du modèle de base validé et ont un nombre de paramètres inférieur à ±10 % de l'original.
  • Pour connaître le matériel disponible et connaître les étapes de déploiement des modèles importés, reportez-vous à Gestion des modèles importés.
  • Si la forme d'unité validée n'est pas disponible dans la région, sélectionnez une option de niveau supérieur. Par exemple, si A100 n'est pas disponible, sélectionnez H100.