Modelo NVIDIA Nemotron Suportado
Você pode importar grandes modelos de linguagem de buckets do Hugging Face e do OCI Object Storage para o OCI Generative AI, criar pontos finais para esses modelos e usá-los no serviço Generative AI.
NVIDIA Nemotron™ é uma família de modelos abertos com pesos abertos, dados de treinamento e receitas, adequados para fluxos de trabalho agênticos, raciocínio de longo contexto, cargas de trabalho de alto volume (por exemplo, automação de tíquetes de TI), uso de ferramentas e RAG. Para os modelos suportados no Hugging Face, consulte os links na tabela a seguir. Saiba mais sobre o NVIDIA Nemotron.
NVIDIA Nemotron
| Abraçando o ID do modelo facial | Capacidade do Modelo | Forma Recomendada da Unidade de Cluster de IA Dedicada |
|---|---|---|
| NVIDIA/NVIDIA-Nemotron-3-Super-120B-A12B-BF16 | TEXT_TO_TEXT | H100_X8 |
| NVIDIA/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8 | TEXT_TO_TEXT | H100_X4 |
| nvidia/Llama-3.1-Nemotron-70B-Instruct-HF | TEXT_TO_TEXT | A100_80G_X4 |
| NVIDIA/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16 | TEXT_TO_TEXT | A100_80G_X1 |