Kompatibles NVIDIA Nemotron Modell

Sie können große Sprachmodelle aus Hugging Face- und OCI Object Storage-Buckets in OCI Generative AI importieren, Endpunkte für diese Modelle erstellen und im generativen KI-Service verwenden.

NVIDIA Nemotron™ ist eine Familie offener Modelle mit offenen Gewichten, Trainingsdaten und Rezepten, die für agentenbezogene Workflows, Argumentation mit langem Kontext, Workloads mit hohem Volumen (z. B. IT-Ticketautomatisierung), die Verwendung von Tools und RAG geeignet sind. Die kompatiblen Modelle von Hugging Face finden Sie in den Links in der folgenden Tabelle. Weitere Informationen zu NVIDIA Nemotron.

NVIDIA Nemotron

Kompatible NVIDIA Nemotron-Modelle
Hugging Face-Modell-ID Modellfähigkeit Empfohlene Ausprägung der dedizierten KI-Clustereinheit
NVIDIA/NVIDIA-Nemotron-3-Super-120B-A12B-BF16 TEXT_TO_TEXT H100_X8
NVIDIA/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8 TEXT_TO_TEXT H100_X4
nvidia/Llama-3.1-Nemotron-70B-Instruct-HF TEXT_TO_TEXT A100_80G_X4
NVIDIA/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16 TEXT_TO_TEXT A100_80G_X1
Wichtig

  • Während Sie alle Chats, Einbettungs- und Feinoptimierungsmodelle importieren können, die über die Open Model Engine (mit vLLM- oder SGLang-Laufzeit) validiert wurden, wurden nur explizit aufgeführte Modelle auf dieser Seite von Oracle anhand von Open-Source-Modelllaufzeiten für diese Modellfamilie bewertet und auf von Oracle unterstützten GPU-Konfigurationen getestet. Ungeachtet des Vorstehenden ist Oracle nicht für Probleme im Zusammenhang mit der Leistung, Verfügbarkeit, dem Betrieb oder der Sicherheit kompatibler Modelle verantwortlich. Nicht aufgelistete Modelle können Kompatibilitätsprobleme aufweisen. Wir empfehlen, alle nicht aufgelisteten Modelle vor der Verwendung in der Produktion zu testen. Erfahren Sie mehr über die importierte Modellarchitektur von OCI Generative AI.

  • Bei importierten Modellen können Sie die vom Modellprovider angegebene native Kontextlänge verwenden. Die effektive maximale Kontextlänge wird jedoch durch das zugrunde liegende Hardwaresetup begrenzt, das Sie für das Hosting dedizierter KI-Cluster in OCI Generative AI auswählen. Um die native Kontextlänge eines Modells voll auszuschöpfen, müssen Sie möglicherweise mehr Hardwareressourcen bereitstellen.
  • Verwenden Sie die fein abgestimmten Modelle nur, wenn sie mit der Transformatorversion des kompatiblen Basismodells übereinstimmen und eine Parameteranzahl innerhalb von ±10% des Originals aufweisen.
  • Verfügbare Hardware und Schritte zum Deployment der importierten Modelle finden Sie unter Importierte Modelle verwalten.
  • Wenn die kompatible Einheitenausprägung in der Region nicht verfügbar ist, wählen Sie eine übergeordnete Option aus. Beispiel: Wenn A100 nicht verfügbar ist, wählen Sie H100 aus.