Modello Nemotron NVIDIA compatibile

Puoi importare modelli di linguaggio di grandi dimensioni dai bucket di storage degli oggetti Hugging Face e OCI nell'AI generativa OCI, creare endpoint per tali modelli e utilizzarli nel servizio AI generativa.

NVIDIA Nemotron™ è una famiglia di modelli aperti con pesi aperti, dati di formazione e ricette, adatti per flussi di lavoro identici, ragionamento a lungo termine, carichi di lavoro ad alto volume (ad esempio, automazione dei ticket IT), uso degli strumenti e RAG. Per i modelli compatibili su Hugging Face, vedere i collegamenti nella tabella seguente. Informazioni su NVIDIA Nemotron.

NVIDIA Nemotron

Modelli compatibili NVIDIA Nemotron
ID modello viso abbraccio	Capacità modello	Forma unità cluster AI dedicata consigliata
nvidia/Llama-3.1-Nemotron-Nano-8B-v1	TEXT_TO_TEXT	A100_80G_X1
nvidia/Llama-3.1-Nemotron-70B-Instruct-HF	TEXT_TO_TEXT	A100_80G_X4
NVIDIA/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4	TEXT_TO_TEXT	B200_X4
NVIDIA/NVIDIA-Nemotron-3-Super-120B-A12B-BF16	TEXT_TO_TEXT	H100_X8
NVIDIA/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8	TESTO_A_TESTO	H100_X4
NVIDIA/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16	TESTO_A_TESTO	A100_80G_X1

Importante

Per i modelli importati, è possibile utilizzare la lunghezza del contesto nativo specificata dal provider del modello. Tuttavia, la lunghezza massima effettiva del contesto è limitata dall'impostazione hardware di base selezionata per l'hosting di cluster AI dedicati in OCI Generative AI. Per sfruttare appieno la lunghezza del contesto nativo di un modello, potrebbe essere necessario eseguire il provisioning di più risorse hardware.
Utilizzare i modelli ottimizzati solo se corrispondono alla versione del trasformatore del modello di base compatibile e hanno un conteggio dei parametri entro ±10% dell'originale.
Per informazioni sull'hardware disponibile e sulla procedura per distribuire i modelli importati, vedere Gestione dei modelli importati.

Documentazione dell'infrastruttura Oracle Cloud

Modello Nemotron NVIDIA compatibile

NVIDIA Nemotron