Kompatible OpenAI-Modelle

Sie können kompatible Modelle aus Hugging Face- und OCI Object Storage-Buckets in OCI Generative AI importieren, Endpunkte für diese Modelle erstellen und sie im generativen KI-Service verwenden.

OpenAI Whisper

Das OpenAI Whisper Large V3 Turbo-Modell ist für automatische Spracherkennung und Audiotranskription optimiert. Dieses Audio-to-Text-Modell ist eine fein abgestimmte Version eines beschnittenen Whisper Large V3-Modells, mit weniger Decoder-Ebenen für eine schnellere Transkription mit einem geringfügigen Qualitäts-Tradeoff. Das Modell unterstützt mehrsprachige Transkription, Sprachidentifikation und Sprachübersetzung von unterstützten Sprachen in englischen Text und eignet sich für latenzempfindliche Anwendungsfälle für die Audioverarbeitung mit hohem Durchsatz. Weitere Informationen finden Sie in der Dokumentation zu Hugging Face unter OpenAI Whisper Large V3 Turbo.

Kompatibles OpenAI Whisper-Modell
Hugging Face-Modell-ID Modellfähigkeit Empfohlene dedizierte KI-Clustereinheitenausprägungen
openai/whisper-large-v3-turbo AUDIO-TO-TEXT
  • H100_X1
  • A100_80G_X1
Wichtig

  • Während Sie alle Chats, Einbettungs- und Feinoptimierungsmodelle importieren können, die mit der Open Model Engine (mit vLLM- oder SGLang-Laufzeit) validiert wurden, wurden nur explizit aufgeführte Modelle auf dieser Seite von Oracle anhand von Open-Source-Modelllaufzeiten für diese Modellfamilie bewertet und auf von Oracle unterstützten GPU-Konfigurationen getestet. Ungeachtet des Vorstehenden ist Oracle nicht für Probleme im Zusammenhang mit der Leistung, Verfügbarkeit, dem Betrieb oder der Sicherheit kompatibler Modelle verantwortlich. Nicht aufgelistete Modelle können Kompatibilitätsprobleme aufweisen. Wir empfehlen, alle nicht aufgelisteten Modelle vor der Verwendung in der Produktion zu testen. Erfahren Sie mehr über die importierte Modellarchitektur von OCI Generative AI.

  • Bei importierten Modellen können Sie die vom Modellprovider angegebene native Kontextlänge verwenden. Die effektive maximale Kontextlänge wird jedoch durch das zugrunde liegende Hardwaresetup begrenzt, das Sie für das Hosting dedizierter KI-Cluster in OCI Generative AI auswählen. Um die native Kontextlänge eines Modells voll auszuschöpfen, müssen Sie möglicherweise mehr Hardwareressourcen bereitstellen.
  • Verwenden Sie die fein abgestimmten Modelle nur, wenn sie mit der Transformatorversion des kompatiblen Basismodells übereinstimmen und eine Parameteranzahl innerhalb von ±10% des Originals aufweisen.
  • Verfügbare Hardware und Schritte zum Deployment der importierten Modelle finden Sie unter Importierte Modelle verwalten.
  • Wenn in einer Region keine empfohlene Ausprägung verfügbar ist, wählen Sie die nächstgelegene verfügbare Alternative aus. Beispiel: Wenn H100_X2 nicht verfügbar ist, A100_80G_X2 jedoch ist, wählen Sie A100_80G_X2 aus. Wenn sowohl H100- als auch A100-Ausprägungen verfügbar sind, wählen Sie H100 aus, um die Performance zu verbessern.