Modelo NVIDIA Nemotron compatible
Puede importar modelos de lenguaje grandes de cubos de Hugging Face y OCI Object Storage a OCI Generative AI, crear puntos finales para esos modelos y utilizarlos en el servicio Generative AI.
NVIDIA Nemotron™ es una familia de modelos abiertos con pesas abiertas, datos de entrenamiento y recetas, adecuados para flujos de trabajo ágiles, razonamiento de contexto largo, cargas de trabajo de gran volumen (por ejemplo, automatización de tickets de TI), uso de herramientas y RAG. Para ver los modelos admitidos en Hugging Face, consulte los enlaces de la siguiente tabla. Obtén más información sobre NVIDIA Nemotron.
NVIDIA Nemotron
| ID de modelo facial de abrazo | Capacidad del modelo | Unidad de cluster de IA dedicada recomendada |
|---|---|---|
| NVIDIA/NVIDIA-Nemotron-3-Super-120B-A12B-BF16 | TEXT_TO_TEXT | H100_X8 |
| NVIDIA/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8 | TEXT_TO_TEXT | H100_X4 |
| nvidia/Llama-3.1-Nemotrón-70B-Instruct-HF | TEXT_TO_TEXT | A100_80G_X4 |
| NVIDIA/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16 | TEXT_TO_TEXT | A100_80G_X1 |