Modèle NVIDIA Nemotron pris en charge
Vous pouvez importer des modèles de langage volumineux à partir de buckets Hugging Face et OCI Object Storage dans OCI Generative AI, créer des adresses pour ces modèles et les utiliser dans le service d'IA générative.
NVIDIA Nemotron™ est une famille de modèles ouverts avec des poids ouverts, des données d'entraînement et des recettes adaptées aux flux de travail agénétiques, au raisonnement en contexte long, aux charges de travail volumineuses (par exemple, automatisation des tickets informatiques), à l'utilisation d'outils et à la RAG. Pour les modèles pris en charge sur Hugging Face, reportez-vous aux liens du tableau suivant. En savoir plus sur NVIDIA Nemotron.
NVIDIA Nemotron
| ID modèle Hugging Face | Capacité du modèle | Forme d'unité de cluster d'IA dédiée recommandée |
|---|---|---|
| NVIDIA/NVIDIA-Nemotron-3-Super-120B-A12B-BF16 | TEXT_TO_TEXT | H100_X8 |
| NVIDIA/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8 | TEXT_TO_TEXT | H100_X4 |
| nvidia/Llama-3.1-Némotron-70B-Instruct-HF | TEXT_TO_TEXT | A100_80G_X4 |
| NVIDIA/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16 | TEXT_TO_TEXT | A100_80G_X1 |