Gestione dei modelli importati (nuovo)
Oltre a utilizzare i modelli pre-addestrati in hosting nell'AI generativa OCI, puoi importare modelli open source e di terze parti supportati (ad esempio, da Hugging Face) nell'AI generativa OCI, ospitarli, creare endpoint e utilizzarli come qualsiasi altro modello.
Prerequisiti viso abbraccio
Prima di importare un modello direttamente da Hugging Face:
- Decidere quale modello supportato da Hugging Face importare e annotare la dimensione dell'unità cluster AI dedicata consigliata.
- Per accedere e utilizzare alcuni modelli, è necessario un token Hugging Face, in particolare le versioni più recenti e con accesso controllato come Llama 3 e Llama 3.1. Per questi modelli, generare un token di accesso dalle impostazioni dell'account Hugging Face in Token di accesso. Assicurarsi che disponga delle autorizzazioni necessarie (almeno l'accesso in "lettura").
Prerequisiti dello storage degli oggetti
Prima di importare un modello da un bucket di storage degli oggetti:
- Se non sei un amministratore OCI, chiedi a uno di concedere a IAM l'autorizzazione per gestire lo storage degli oggetti nel compartimento:
allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket> - Decidere un modello che funziona con l'endpoint
/v1/chat/completions: solo questi modelli sono supportati. - Assicurarsi che il modello supporti solo una di queste funzionalità:
- TEXT_TO_TEXT: testo in entrata e testo in uscita
- IMAGE_TEXT_TO_TEXT: immagine o testo o entrambi in, text out
- EMBEDDING: testo in entrata, incorporamenti vettoriali in uscita
- RERANK: query e documenti dei candidati, punteggi di pertinenza e un elenco riordinato in uscita
- Salva gli artifact del modello in un bucket di storage degli oggetti.
- Importante: il file di configurazione deve essere denominato
config.jsonper un'importazione riuscita, simile alla maggior parte dei modelli Hugging Face.
Richiesta di risorse e prezzi
Per raggiungere un modello importato, creare un endpoint per tale modello su un cluster AI dedicato. Utilizzare la tabella seguente per richiedere risorse cluster AI dedicate prima di importare un modello.
| Dimensione unità cluster AI dedicata | Nome limite | Unità richieste | Conteggio unità AI |
|---|---|---|---|
| A10_X1 | dedicated-unit-a10-count |
1 | 1,77 |
| A10_X2 | dedicated-unit-a10-count |
2 | 3,54 |
| A10_X4 | dedicated-unit-a10-count |
4 | 7,08 |
| A100_40G_X1 | dedicated-unit-a100-40g-count |
1 | 2,7 |
| A100_40G_X2 | dedicated-unit-a100-40g-count |
2 | 5,4 |
| A100_40G_X4 | dedicated-unit-a100-40g-count |
4 | 10,8 |
| A100_40G_X8 | dedicated-unit-a100-40g-count |
8 | 21,6 |
| A100_80G_X1 | dedicated-unit-a100-80g-count |
1 | 3,24 |
| A100_80G_X2 | dedicated-unit-a100-80g-count |
2 | 6,48 |
| A100_80G_X4 | dedicated-unit-a100-80g-count |
4 | 12,96 |
| A100_80G_X8 | dedicated-unit-a100-80g-count |
8 | 25,92 |
| H100_X1 | dedicated-unit-h100-count |
1 | 6,01 |
| H100_X2 | dedicated-unit-h100-count |
2 | 12,02 |
| H100_X4 | dedicated-unit-h100-count |
4 | 24,04 |
| H100_X8 | dedicated-unit-h100-count |
8 | 48,08 |
| H200_X1 | dedicated-unit-h200-count |
1 | 6,22 |
| H200_X2 | dedicated-unit-h200-count |
2 | 12,44 |
| H200_X4 | dedicated-unit-h200-count |
4 | 24,88 |
| H200_X8 | dedicated-unit-h200-count |
8 | 49,76 |
Per richiedere le risorse per la dimensione dell'unità cluster AI dedicata consigliata, vedere Richiesta di un limite di risorse.
Per calcolare il prezzo, moltiplicare il prezzo per Unità AI all'ora per Oracle Cloud Infrastructure Generative AI - Importazione modello nella pagina Informazioni sulla pagina di determinazione prezzi per il conteggio delle unità AI in questa pagina.
Task per l'importazione di un modello
- Importare il modello utilizzando una delle seguenti opzioni:
- Creare un cluster AI dedicato di hosting per il modello importato con una forma di unità consigliata.
- Creare un endpoint.
- Chiama il modello tramite OCI Generative AI API, SDK o usa il modello nell'area di gioco.
Gestione dei modelli importati
Dopo aver eseguito i prerequisiti e importato un modello, è possibile eseguire i task riportati di seguito sui modelli importati.