Unterstützte OpenAI-Modelle
Sie können große Sprachmodelle aus Hugging Face- und OCI Object Storage-Buckets in OCI Generative AI importieren, Endpunkte für diese Modelle erstellen und im generativen KI-Service verwenden.
Diese Modelle verfügen über eine fortschrittliche Open-weight-Transformer-Architektur mit Mixture-of-Experts-(MoE-)Architektur, die für effizientes, hochwertiges Sprachverständnis und eine große Kontextverarbeitung optimiert ist. Weitere Informationen finden Sie unter GptOss in der Hugging Face-Dokumentation.
GptOss
| Hugging Face-Modell-ID | Modellfähigkeit | Empfohlene Ausprägung der dedizierten KI-Clustereinheit |
|---|---|---|
| openai/gpt-oss-20b | TEXT_TO_TEXT | H100_X1 |
| openai/gpt-oss-120b | TEXT_TO_TEXT | H100_X2 |
-
Sie können zwar beliebige Chats, Einbettungs- und Feinoptimierungsmodelle importieren, die von der Open Model Engine (mit vLLM- oder SGLang-Laufzeit) unterstützt werden, nur explizit aufgeführte Modelle auf dieser Seite werden für diese Modellfamilie unterstützt. Nicht aufgelistete Modelle können Kompatibilitätsprobleme aufweisen. Wir empfehlen, alle nicht aufgelisteten Modelle vor der Verwendung in der Produktion zu testen. Erfahren Sie mehr über die importierte Modellarchitektur von OCI Generative AI.
- Importierte Modelle unterstützen die vom Modellprovider angegebene native Kontextlänge. Die effektive maximale Kontextlänge ist jedoch auch durch das zugrunde liegende Hardwaresetup von OCI Generative AI begrenzt. Um die native Kontextlänge eines Modells voll auszuschöpfen, müssen Sie möglicherweise mehr Hardwareressourcen bereitstellen.
- Fein abgestimmte Modelle werden nur unterstützt, wenn sie mit der Transformatorversion des unterstützten Basismodells übereinstimmen und eine Parameteranzahl innerhalb von ±10% des Originals aufweisen.
- Verfügbare Hardware und Schritte zum Deployment der importierten Modelle finden Sie unter Importierte Modelle verwalten.
- Wenn die empfohlene Einheitenausprägung in der Region nicht verfügbar ist, wählen Sie eine übergeordnete Option aus. Beispiel: Wenn A100 nicht verfügbar ist, wählen Sie H100 aus.