Gestione dei modelli importati (nuovo)

Oltre a utilizzare i modelli pre-addestrati in hosting nell'AI generativa OCI, puoi importare modelli open source e di terze parti supportati (ad esempio, da Hugging Face) nell'AI generativa OCI, ospitarli, creare endpoint e utilizzarli come qualsiasi altro modello.

Prerequisiti viso abbraccio

Prima di importare un modello direttamente da Hugging Face:

  • Decidere quale modello supportato da Hugging Face importare e annotare la dimensione dell'unità cluster AI dedicata consigliata.
  • Per accedere e utilizzare alcuni modelli, è necessario un token Hugging Face, in particolare le versioni più recenti e con accesso controllato come Llama 3 e Llama 3.1. Per questi modelli, generare un token di accesso dalle impostazioni dell'account Hugging Face in Token di accesso. Assicurarsi che disponga delle autorizzazioni necessarie (almeno l'accesso in "lettura").

Prerequisiti dello storage degli oggetti

Prima di importare un modello da un bucket di storage degli oggetti:

  • Se non sei un amministratore OCI, chiedi a uno di concedere a IAM l'autorizzazione per gestire lo storage degli oggetti nel compartimento:
    allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket>
                                
  • Decidere un modello che funziona con l'endpoint /v1/chat/completions: solo questi modelli sono supportati.
  • Assicurarsi che il modello supporti solo una di queste funzionalità:
    • TEXT_TO_TEXT: testo in entrata e testo in uscita
    • IMAGE_TEXT_TO_TEXT: immagine o testo o entrambi in, text out
    • EMBEDDING: testo in entrata, incorporamenti vettoriali in uscita
    • RERANK: query e documenti dei candidati, punteggi di pertinenza e un elenco riordinato in uscita
  • Salva gli artifact del modello in un bucket di storage degli oggetti.
  • Importante: il file di configurazione deve essere denominato config.json per un'importazione riuscita, simile alla maggior parte dei modelli Hugging Face.

Richiesta di risorse e prezzi

Per raggiungere un modello importato, creare un endpoint per tale modello su un cluster AI dedicato. Utilizzare la tabella seguente per richiedere risorse cluster AI dedicate prima di importare un modello.

Dimensioni unità cluster AI dedicate per modelli importati
Dimensione unità cluster AI dedicata Nome limite Unità richieste Conteggio unità AI
A10_X1 dedicated-unit-a10-count 1 1,77
A10_X2 dedicated-unit-a10-count 2 3,54
A10_X4 dedicated-unit-a10-count 4 7,08
A100_40G_X1 dedicated-unit-a100-40g-count 1 2,7
A100_40G_X2 dedicated-unit-a100-40g-count 2 5,4
A100_40G_X4 dedicated-unit-a100-40g-count 4 10,8
A100_40G_X8 dedicated-unit-a100-40g-count 8 21,6
A100_80G_X1 dedicated-unit-a100-80g-count 1 3,24
A100_80G_X2 dedicated-unit-a100-80g-count 2 6,48
A100_80G_X4 dedicated-unit-a100-80g-count 4 12,96
A100_80G_X8 dedicated-unit-a100-80g-count 8 25,92
H100_X1 dedicated-unit-h100-count 1 6,01
H100_X2 dedicated-unit-h100-count 2 12,02
H100_X4 dedicated-unit-h100-count 4 24,04
H100_X8 dedicated-unit-h100-count 8 48,08
H200_X1 dedicated-unit-h200-count 1 6,22
H200_X2 dedicated-unit-h200-count 2 12,44
H200_X4 dedicated-unit-h200-count 4 24,88
H200_X8 dedicated-unit-h200-count 8 49,76
Suggerimento

Per richiedere le risorse per la dimensione dell'unità cluster AI dedicata consigliata, vedere Richiesta di un limite di risorse.

Per calcolare il prezzo, moltiplicare il prezzo per Unità AI all'ora per Oracle Cloud Infrastructure Generative AI - Importazione modello nella pagina Informazioni sulla pagina di determinazione prezzi per il conteggio delle unità AI in questa pagina.