Pagamento per cluster AI dedicati

Puoi ottenere i seguenti vantaggi per l'uso dei cluster AI dedicati nell'AI generativa OCI:

  • Prezzi prevedibili che non fluttuano con la domanda.
  • Ottimo per modelli di ottimizzazione o hosting.
  • Impegno minimo per l'hosting: 744 ore per unità per cluster di hosting.
  • Impegno minimo per il tuning: 1 unità di ora per ogni job di ottimizzazione. (A seconda del modello, la messa a punto richiede almeno 2 unità).
Nota

Per informazioni sui modelli disponibili per l'ottimizzazione, vedere Abbinamento dei modelli di base ai cluster.

Gli esempi riportati di seguito calcolano il costo del cluster AI dedicato nell'AI generativa OCI. Per calcolare il costo di inferenza su richiesta, vedere Pagamento per inferenza su richiesta.

Modelli corrispondenti ai prezzi delle unità cluster dedicate

Se esegui l'hosting di modelli di base o li ottimizzazione su cluster AI dedicati, il costo viene addebitato in base all'ora di unità anziché alla transazione. In questo caso, vedere la tabella riportata di seguito per calcolare il costo del cluster AI dedicato per i modelli di chat.

Importante

Alcuni modelli di base pre-addestrati di base di AI generativa OCI supportati per la modalità di servizio dedicata sono ora non più validi e verranno ritirati non prima di 6 mesi dopo il rilascio del 1o modello di sostituzione. È possibile ospitare un modello di base o ottimizzare un modello di base e ospitare il modello ottimizzato in un cluster AI dedicato (modalità di servizio dedicata) fino a quando il modello di base non viene ritirato. Per le date di ritiro della modalità di servizio dedicata, vedere Ritiro dei modelli.

Modelli chat

Modello base Cluster di ottimizzazione Gruppo di hosting Informazioni pagina determinazione prezzi Richiedi aumento limite cluster
  • Nome modello: Meta Llama 4 Maverick
  • Nome modello OCI: meta.llama-4-maverick-17b-128e-instruct-fp8
Non disponibile per la messa a punto
  • Dimensione unità: Large Generic 2
  • Unità obbligatorie: 1
  • Nome prodotto pagina prezzi: Large Meta - Dedicated
  • Nome limite: dedicated-unit-llama2-70-count
  • Per l'hosting, aumenta il limite delle richieste di: 4
  • Nome modello: Meta Llama 4 Scout
  • Nome modello OCI: meta.llama-4-scout-17b-16e-instruct
Non disponibile per la messa a punto
  • Dimensione unità: Large Generic V2
  • Unità obbligatorie: 1
  • Nome prodotto pagina prezzi: Large Meta - Dedicated
  • Nome limite: dedicated-unit-llama2-70-count
  • Per l'hosting, aumenta il limite delle richieste di: 2
  • Nome modello: Cohere Command A
  • Nome modello OCI: cohere.command-a-03-2025
Non disponibile per la messa a punto
  • Dimensione unità: LARGE_COHERE_V3
  • Unità obbligatorie: 1
  • Nome prodotto pagina prezzi: Large Cohere - Dedicated
  • Nome limite: dedicated-unit-large-cohere-count
  • Per l'hosting, aumenta il limite delle richieste di: 1
  • Nome modello: Cohere Command R
  • Nome modello OCI: cohere.command-r-16k (non più valido)
  • Dimensione unità: Small Cohere V2
  • Unità obbligatorie: 8
  • Dimensione unità: Small Cohere V2
  • Unità obbligatorie: 1
  • Nome prodotto pagina prezzi: Small Cohere - Dedicated
  • Per l'ottimizzazione, moltiplicare il prezzo unitario: x8
  • Nome limite: dedicated-unit-small-cohere-count
  • Per l'hosting, aumenta il limite delle richieste di: 1
  • Per l'ottimizzazione, aumenta il limite delle richieste di: 8
  • Nome modello: Command R 08-2024
  • Nome modello OCI: cohere.command-r-08-2024
  • Dimensione unità: Small Cohere V2
  • Unità obbligatorie: 8
  • Dimensione unità: Small Cohere V2
  • Unità obbligatorie: 1
  • Nome prodotto pagina prezzi: Small Cohere - Dedicated
  • Per l'ottimizzazione, moltiplicare il prezzo unitario: x8
  • Nome limite: dedicated-unit-small-cohere-count
  • Per l'hosting, richiedere l'aumento del limite entro: 1
  • Per l'ottimizzazione, aumenta il limite delle richieste di: 8
  • Nome modello: Cohere Command R+
  • Nome modello OCI: cohere.command-r-plus (non più valido)
Non disponibile per la messa a punto
  • Dimensione unità: Large Cohere V2_2
  • Unità obbligatorie: 1
  • Nome prodotto pagina prezzi: Large Cohere - Dedicated
  • Per l'hosting, moltiplica il prezzo unitario: x2
  • Nome limite: dedicated-unit-large-cohere-count
  • Per l'hosting, aumenta il limite delle richieste di: 2
  • Nome modello: Command R+ 08-2024
  • Nome modello OCI: cohere.command-r-plus-08-2024
Non disponibile per la messa a punto
  • Dimensione unità: Large Cohere V2_2
  • Unità obbligatorie: 1
  • Nome prodotto pagina determinazione prezzi: Large Cohere - Dedicated
  • Per l'hosting, moltiplica il prezzo unitario: x2
  • Nome limite: dedicated-unit-large-cohere-count
  • Per l'hosting, aumenta il limite delle richieste di: 2
  • Nome modello: Meta Llama 3.3 (70B)
  • Nome modello OCI: meta.llama-3.3-70b-instruct
  • Dimensione unità: Large Generic
  • Unità obbligatorie: 2
  • Dimensione unità: Large Generic
  • Unità obbligatorie: 1
  • Nome prodotto pagina prezzi: Large Meta - Dedicated
  • Per l'hosting, moltiplica il prezzo unitario: x2
  • Per l'ottimizzazione, moltiplicare il prezzo unitario: x4
  • Nome limite: dedicated-unit-llama2-70-count
  • Per l'hosting, aumenta il limite delle richieste di: 2
  • Per l'ottimizzazione, aumenta il limite delle richieste di: 4
  • Nome modello: Meta Llama 3.2 11B Vision
  • Nome modello OCI: meta.llama-3.2-11b-vision-instruct
Non disponibile per la messa a punto
  • Dimensione unità: Small Generic V2
  • Unità obbligatorie: 1
  • Nome prodotto pagina prezzi: Large Meta - Dedicated
  • Per l'hosting, moltiplica il prezzo unitario: x(0.5)
  • Nome limite: dedicated-unit-llama2-70-count
  • Per l'hosting, aumenta il limite delle richieste di:1
  • Nome modello: Meta Llama 3.2 90B Vision
  • Nome modello OCI: meta.llama-3.2-90b-vision-instruct
Non disponibile per l'ottimizzazione
  • Dimensione unità: Large Generic V2
  • Unità obbligatorie: 1
  • Nome prodotto pagina prezzi: Large Meta - Dedicated
  • Per l'hosting, moltiplica il prezzo unitario: x2
  • Nome limite: dedicated-unit-llama2-70-count
  • Per l'hosting, aumenta il limite delle richieste di: 2
  • Nome modello: Meta Llama 3.1 (70B)
  • Nome modello OCI: meta.llama-3.1-70b-instruct
  • Dimensione unità: Large Generic
  • Unità obbligatorie: 2
  • Dimensione unità: Large Generic
  • Unità obbligatorie: 1
  • Nome prodotto pagina prezzi: Large Meta - Dedicated
  • Per l'hosting, moltiplica il prezzo unitario: x2
  • Per l'ottimizzazione, moltiplicare il prezzo unitario: x4
  • Nome limite: dedicated-unit-llama2-70-count
  • Per l'hosting, aumenta il limite delle richieste di: 2
  • Per l'ottimizzazione, aumenta il limite delle richieste di: 4
  • Nome modello: Meta Llama 3.1 (405B)
  • Nome modello OCI: meta.llama-3.1-405b-instruct
Non disponibile per l'ottimizzazione
  • Dimensione unità: Large Generic 2
  • Unità obbligatorie: 1
  • Nome prodotto pagina determinazione prezzi: Large Meta - Dedicated
  • Per l'hosting, moltiplica il prezzo unitario: x4
  • Nome limite: dedicated-unit-llama2-70-count
  • Per l'hosting, aumenta il limite delle richieste di: 4
  • Nome modello: Meta Llama 3
  • Nome modello OCI: meta.llama-3-70b-instruct (non più valido)
  • Dimensione unità: Large Generic
  • Unità obbligatorie: 2
  • Dimensione unità: Large Generic
  • Unità obbligatorie: 1
  • Nome prodotto pagina determinazione prezzi: Large Meta - Dedicated
  • Per l'hosting, moltiplica il prezzo unitario: x2
  • Per l'ottimizzazione, moltiplicare il prezzo unitario: x4
  • Nome limite: dedicated-unit-llama2-70-count
  • Per l'hosting, richiedere l'aumento del limite entro: 2
  • Per l'ottimizzazione, aumenta il limite delle richieste di: 4
Importante

È necessario richiedere un aumento del limite per utilizzare le seguenti risorse:

Famiglia Meta Llama

  • Per ospitare un modello Meta Llama 4 Maverick, è necessario richiedere dedicated-unit-llama2-70-count per aumentare di 4.

  • Per ospitare un modello Meta Llama 4 Scout, è necessario richiedere dedicated-unit-llama2-70-count per aumentare di 2.

  • Per ospitare un modello Meta Llama 3.3 (70B), è necessario richiedere a dedicated-unit-llama2-70-count un aumento di 2.

  • Per ottimizzare un modello Meta Llama 3.3 (70B), è necessario richiedere a dedicated-unit-llama2-70-count di aumentare di 4.

  • Per ospitare un modello Meta Llama 3.2 11B Vision , è necessario richiedere a dedicated-unit-llama2-70-count un aumento di 1.

  • Per ospitare un modello Meta Llama 3.2 90B Vision , è necessario richiedere a dedicated-unit-llama2-70-count un aumento di 2.

  • Per ospitare un modello Meta Llama 3.1 (70B), è necessario richiedere a dedicated-unit-llama2-70-count un aumento di 2.

  • Per ottimizzare un modello Meta Llama 3.1 (70B), è necessario richiedere a dedicated-unit-llama2-70-count di aumentare di 4.

  • Per ospitare un modello Meta Llama 3.1 (405B), è necessario richiedere a dedicated-unit-llama2-70-count un aumento di 4.

Famiglia Comando Cohere

  • Per ospitare un modello Cohere Command A, è necessario richiedere dedicated-unit-large-cohere-count per aumentare di 1.

  • Per ospitare un modello Cohere Command R (deprecato), è necessario richiedere dedicated-unit-small-cohere-count per aumentare di 1.

  • Per perfezionare un modello Cohere Command R (deprecato), è necessario richiedere dedicated-unit-small-cohere-count per aumentarne di 8.

  • Per ospitare un modello Cohere Command R 08-2024, è necessario richiedere a dedicated-unit-small-cohere-count un aumento di 1.

  • Per ottimizzare un modello Cohere Command R 08-2024, è necessario richiedere a dedicated-unit-small-cohere-count un aumento di 8.

  • Per ospitare un modello Cohere Command R+ (deprecato), è necessario richiedere dedicated-unit-large-cohere-count per aumentare di 2.

  • Per ospitare un modello Cohere Command R+ 08-2024, è necessario richiedere a dedicated-unit-large-cohere-count un aumento di 2.

Riferimenti: Limiti del servizio per l'intelligenza artificiale generativa e Richiedi aumento del limite del cluster

Per la generazione di testo, il riepilogo e l'incorporamento di testo, vedere le tabelle in Abbinamento dei modelli di base ai cluster.

Hosting di un modello di base Esempio 1

John desidera ospitare un'istanza del modello Command R+ 08-2024 (cohere.command-r-plus-08-2024) sull'infrastruttura dedicata. John elimina il cluster dopo 40 giorni e desidera conoscere il costo del cluster. Per ospitare un modello cohere.command-r-plus-08-2024, John deve prima identificare la dimensione dell'unità che può ospitare il modello cohere.command-r-plus-08-2024. La dimensione dell'unità per il modello cohere.command-r-plus-08-2024 è un'unità Large Cohere V2_2. Vedere corrispondenza dei modelli di base ai cluster.

John richiede almeno un'unità Large Cohere V2_2 per ospitare il modello cohere.command-r-plus-08-2024. Di seguito sono riportati i passi per calcolare il costo di un cluster di hosting con un'unità Large Cohere V2_2.

  1. Calcolare le ore unità per 40 giorni.
    40 days x 24 hours per day x 1 unit = 960 unit hours.
  2. Assicurarsi che le ore di unità superino l'impegno minimo per l'hosting dei modelli.
    960 unit hours > 744 minimum unit hours
  3. Vai su Prezzi AI e in AI generativa OCI, per Oracle Cloud Infrastructure Generative AI- Large Cohere - Dedicated, trova <Large-Cohere-dedicated-unit-per-hour-price>.
  4. Nella pagina Corrispondenza tra modelli di base e cluster, individuare il moltiplicatore per il modello cohere.command-r-plus-08-2024:
    For Hosting, Multiply the Unit Price: x 2
  5. Calcola il prezzo per 40 giorni.
    price = (960 unit hours) x $<Large-Cohere-dedicated-unit-per-hour-price> x 2

Hosting di un modello di base Esempio 2

Alice vuole ospitare un'istanza del modello Command R 08-2024 (cohere.command-r-08-2024) su un'infrastruttura dedicata. Per ospitare un modello cohere.command-r-08-2024, Alice deve prima identificare la dimensione dell'unità che può ospitare il modello Command R 08-2024. La dimensione unità per Command R 08-2024 è un'unità Small Cohere V2. Vedere corrispondenza dei modelli di base ai cluster.

Alice decide di acquistare tre unità di Small Cohere V2 per gestire un volume di chiamata più elevato al modello rispetto a quello fornito da una singola unità. Alice prevede di eliminare il cluster dopo cinque giorni. Ecco i passaggi per calcolare il costo di un cluster di hosting con tre unità Small Cohere V2 per cinque giorni.

  1. Calcolare le ore di unità.
    5 days x 24 hours per day x 3 units = 360 unit hours. 
  2. Confrontare le ore di unità con l'impegno minimo per l'hosting dei modelli.
    360 unit hours < 744 minimum unit hours
    Alice is charged for 744 unit hours.
  3. Vai su Prezzi AI e in AI generativa OCI, per Oracle Cloud Infrastructure Generative AI- Small Cohere - Dedicated, trova <Small-Cohere-dedicated-unit-per-hour-price>.
  4. Nella pagina Corrispondenza tra modelli di base e cluster, individuare il moltiplicatore per il modello cohere.command-r-08-2024.

    Non è necessario moltiplicare il prezzo per l'hosting del modello cohere.command-r-08-2024.

  5. Calcolare il costo per cinque giorni.
    price = (744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>

Ottimizzazione e hosting di un esempio di modello

Bob vuole perfezionare un modello Command R 08-2024 (cohere.command-r-08-2024). Bob crea un cluster AI fine-tuning dedicato con il valore preimpostato di otto unità Small Cohere V2. Bob crea un modello personalizzato sul cluster AI fine-tuning dedicato e perfeziona il modello di base Command R 08-2024 con i dati di addestramento. Il completamento del lavoro di messa a punto richiede 5 ore. Bob crea un cluster di messa a punto ogni settimana.

Per ospitare un modello cohere.command-r-08-2024, Bob deve identificare la dimensione dell'unità che può ospitare il modello cohere.command-r-08-2024. La dimensione dell'unità per il modello cohere.command-r-08-2024 è un'unità Small Cohere V2. Vedere corrispondenza dei modelli di base ai cluster. Bob può ospitare fino a 50 modelli ottimizzati su un singolo cluster di hosting. Ecco i passaggi per calcolare il costo mensile per la messa a punto e l'hosting dei modelli.

  1. Calcolare le ore di unità per ogni messa a punto.
    Each fine-tuning cluster requires 8 units and each cluster is active for 5 hours
    fine-tuning per cluster = 40 unit-hours
  2. Confrontare le ore di unità con l'impegno minimo per la messa a punto dei modelli.
    40 unit hours > 1 unit hour
  3. Calcolare le ore di unità per l'hosting.
    31 days x 24 hours per day x 1 unit = 744 unit hours
  4. Confrontare le ore di unità con l'impegno minimo per l'hosting dei modelli.
    744 unit hours = 744 minimum unit hours
  5. Vai su Prezzi AI e in AI generativa OCI, per Oracle Cloud Infrastructure Generative AI- Small Cohere - Dedicated, trova <Small-Cohere-dedicated-unit-per-hour-price>.
  6. Trova il prezzo mensile totale.
    fine-tuning price = (40 unit hours) per week x (4 weeks) x $<Small-Cohere-dedicated-unit-per-hour-price> 
                                
    fine-tuning price = 160 x <Small-Cohere-dedicated-unit-per-hour-price>
    hosting price = (744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>
    total monthly price = (160 + 744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>
Suggerimento

Oltre a calcolare il prezzo, è possibile stimare il costo selezionando la categoria AI e Machine Learning e caricando il valutatore dei costi per l'AI generativa OCI.