Unterstützte Google-Modelle
Sie können große Sprachmodelle aus Hugging Face- und OCI Object Storage-Buckets in OCI Generative AI importieren, Endpunkte für diese Modelle erstellen und im generativen KI-Service verwenden.
Die Google Gemma-Serie, einschließlich Gemma2- und Gemma3-Open-Source-Modelle, wurde für breite Anforderungen an die Sprachverarbeitung und hohe Vielseitigkeit entwickelt. Weitere Informationen finden Sie in der Hugging Face-Dokumentation unter Gemma2 und Gemma3.
Gemma
| Hugging Face-Modell-ID | Modellfähigkeit | Empfohlene Ausprägung der dedizierten KI-Clustereinheit |
|---|---|---|
| google/gemma-3-4b-it | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-3-270m-it | TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-3-27b-it | IMAGE_TEXT_TO_TEXT | A100_80G_X2 |
| google/gemma-3-12b-it | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-3-1b-it | TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-2-9b-it | TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-2-27b-it | TEXT_TO_TEXT | A100_80G_X2 |
| google/gemma-2-2b-it | TEXT_TO_TEXT | A100_80G_X1 |
-
Sie können zwar beliebige Chats, Einbettungs- und Feinoptimierungsmodelle importieren, die von der Open Model Engine (mit vLLM- oder SGLang-Laufzeit) unterstützt werden, nur explizit aufgeführte Modelle auf dieser Seite werden für diese Modellfamilie unterstützt. Nicht aufgelistete Modelle können Kompatibilitätsprobleme aufweisen. Wir empfehlen, alle nicht aufgelisteten Modelle vor der Verwendung in der Produktion zu testen. Erfahren Sie mehr über die importierte Modellarchitektur von OCI Generative AI.
- Importierte Modelle unterstützen die vom Modellprovider angegebene native Kontextlänge. Die effektive maximale Kontextlänge ist jedoch auch durch das zugrunde liegende Hardwaresetup von OCI Generative AI begrenzt. Um die native Kontextlänge eines Modells voll auszuschöpfen, müssen Sie möglicherweise mehr Hardwareressourcen bereitstellen.
- Fein abgestimmte Modelle werden nur unterstützt, wenn sie mit der Transformatorversion des unterstützten Basismodells übereinstimmen und eine Parameteranzahl innerhalb von ±10% des Originals aufweisen.
- Verfügbare Hardware und Schritte zum Deployment der importierten Modelle finden Sie unter Importierte Modelle verwalten.
- Wenn die empfohlene Einheitenausprägung in der Region nicht verfügbar ist, wählen Sie eine übergeordnete Option aus. Beispiel: Wenn A100 nicht verfügbar ist, wählen Sie H100 aus.