Modèle NVIDIA Nemotron pris en charge
Vous pouvez importer de grands modèles de langage à partir de seaux de stockage d'objets Hugging Face et OCI dans le service d'intelligence artificielle générative pour OCI, créer des points d'extrémité pour ces modèles et les utiliser dans le service d'intelligence artificielle générative.
NVIDIA Nemotron™ est une famille de modèles ouverts avec des poids ouverts, des données d'entraînement et des recettes, adaptés aux flux de travail agéntiques, au raisonnement en contexte long, aux charges de travail à volume élevé (par exemple, l'automatisation des tickets informatiques), à l'utilisation d'outils et à la RAG. Pour les modèles pris en charge sur Hugging Face, voir les liens dans le tableau suivant. En savoir plus sur NVIDIA Nemotron.
NVIDIA Nemotron
| ID modèle de visage Hugging | Capacité du modèle | Forme d'unité de grappe dédiée à l'IA recommandée |
|---|---|---|
| NVIDIA/NVIDIA-Nemotron-3-Super-120B-A12B-BF16 | TEXT_TO_TEXT | H100_X8 |
| NVIDIA/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8 | TEXT_TO_TEXT | H100_X4 |
| nvidia/Llama-3.1-Nemotron-70B-Instruction-HF | TEXT_TO_TEXT | A100_80G_X4 |
| NVIDIA/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16 | TEXT_TO_TEXT | A100_80G_X1 |