Modelli Microsoft compatibili
Puoi importare modelli di linguaggio di grandi dimensioni dai bucket di storage degli oggetti Hugging Face e OCI nell'AI generativa OCI, creare endpoint per tali modelli e utilizzarli nel servizio AI generativa.
I modelli Microsoft Phi-3, noti per la loro efficienza e compattezza, sono progettati per prestazioni scalabili e flessibili. Consulta la documentazione di Phi-3 su Hugging Face.
Phi 3
| ID modello viso abbraccio | Capacità modello | Dimensione unità cluster AI dedicata consigliata |
|---|---|---|
| microsoft/phi-4 | TEXT_TO_TEXT | A100_80G_X1 |
| microsoft/Phi-3-mini-4k-istruzioni | TEXT_TO_TEXT | A100_80G_X1 |
| microsoft/Phi-3-mini-128k-istruzioni | TEXT_TO_TEXT | A100_80G_X1 |
| microsoft/Phi-3-small-8k-istruzioni | TEXT_TO_TEXT | A100_80G_X1 |
| microsoft/Phi-3-small-128k-istruzioni | TEXT_TO_TEXT | A100_80G_X1 |
| microsoft/Phi-3-medium-4k-istruzioni | TEXT_TO_TEXT | A100_80G_X1 |
| microsoft/Phi-3-medium-128k-istruzioni | TEXT_TO_TEXT | A100_80G_X1 |
| microsoft/Phi-3-vision-128k-istruzioni | IMAGE_TEXT_TO_TEXT | H100_X1 |
-
Sebbene sia possibile importare qualsiasi modello di chat, incorporamento (e ottimizzato) convalidato tramite Open Model Engine (con runtime vLLM o SGLang), solo i modelli elencati in modo esplicito in questa pagina sono stati valutati da Oracle per questa famiglia di modelli rispetto ai runtime dei modelli open source e testati su configurazioni GPU supportate da Oracle. In deroga a quanto sopra, Oracle non è responsabile di eventuali problemi relativi a prestazioni, disponibilità, funzionamento o sicurezza dei Modelli Compatibili. I modelli non elencati potrebbero presentare problemi di compatibilità e si consiglia di testare qualsiasi modello non elencato prima dell'uso in produzione. Scopri di più sull'architettura del modello importato dall'AI generativa OCI.
- Per i modelli importati, è possibile utilizzare la lunghezza del contesto nativo specificata dal provider del modello. Tuttavia, la lunghezza massima effettiva del contesto è limitata dall'impostazione hardware di base selezionata per l'hosting dei cluster AI dedicati in OCI Generative AI. Per sfruttare appieno la lunghezza del contesto nativo di un modello, potrebbe essere necessario eseguire il provisioning di più risorse hardware.
- Utilizzare i modelli ottimizzati solo se corrispondono alla versione del trasformatore del modello di base compatibile e hanno un conteggio dei parametri entro ±10% dell'originale.
- Per informazioni sull'hardware disponibile e sulla procedura per distribuire i modelli importati, vedere Gestione dei modelli importati.
- Se una forma consigliata non è disponibile in un'area, selezionare l'alternativa più vicina disponibile. Ad esempio, se
H100_X2non è disponibile maA100_80G_X2è, selezionareA100_80G_X2. Se sono disponibili entrambe le forme H100 e A100, selezionare H100 per ottenere prestazioni migliori.