Dettagli delle metriche nell'AI generativa

Puoi monitorare le risorse OCI Generative AI tramite le metriche fornite in questo servizio. Puoi anche utilizzare il servizio di monitoraggio OCI per creare query e allarmi personalizzati per ricevere una notifica quando queste metriche soddisfano i trigger specificati dagli allarmi.

Metriche cluster AI dedicata di hosting

In questa sezione sono elencate le metriche per i cluster AI dedicati hosting. I cluster dedicati fine-tuning non visualizzano metriche.


Nome visualizzato metrica	Descrizione
Utilizzo	Percentuale media di utilizzo della GPU in tutte le GPU nel cluster AI dedicato
Numero totale di input	Numero di token di input elaborati dai modelli in questo cluster AI dedicato di hosting
Numero totale di output	Numero di token di output elaborati dai modelli in questo cluster AI dedicato di hosting

È possibile ottenere le metriche precedenti dalla pagina dei dettagli di un cluster AI dedicato in hosting.

Metriche endpoint

In questa sezione vengono elencate le metriche per gli endpoint del modello nell'intelligenza artificiale generativa.


Nome visualizzato metrica	Descrizione
Tempo di elaborazione totale	Tempo totale di elaborazione per il completamento di una chiamata
Numero di chiamate	Numero di token di input elaborati dal modello ospitato su questo endpoint
Conteggio errori servizio	Numero di chiamate con un errore interno del servizio
Conteggio errori client	Numero di chiamate con un errore lato client
Numero totale di input	Numero di token di input elaborati dal modello ospitato su questo endpoint
Numero totale di output	Numero di token di output elaborati dal modello ospitato su questo endpoint
Tasso di successo delle chiamate	Chiamate riuscite divise per il numero totale di chiamate

È possibile ottenere le metriche precedenti dalla pagina dei dettagli di un endpoint.

Metriche per query personalizzate

È possibile creare query e allarmi personalizzati per le metriche degli endpoint e del cluster AI generativa tramite il servizio di monitoraggio.

In questa sezione sono elencati i parametri che è possibile utilizzare per creare query personalizzate per le metriche AI generativa utilizzando il servizio di monitoraggio.


Parametro metrica	Nome visualizzato	Descrizione
`ClientErrorCount`	Conteggio errori client	Numero di chiamate con un errore lato client
`InputTokenCount`	Numero totale di input	Numero di token di input elaborati dai modelli ospitati in questa risorsa
`InvocationLatency`	Tempo di elaborazione totale	Tempo totale di elaborazione per il completamento di una chiamata su questa risorsa
`OutputTokenCount`	Numero totale di output	Numero di token di output elaborati dai modelli ospitati in questa risorsa
`ServerErrorCount`	Conteggio errori servizio	Numero di chiamate con un errore interno del servizio
`TotalInvocationCount`	Numero di chiamate	Numero di chiamate

Per i passi su come creare queste query personalizzate, vedere Creazione di una query per le metriche AI generativa.

Documentazione dell'infrastruttura Oracle Cloud

Dettagli delle metriche nell'AI generativa

Metriche cluster AI dedicata di hosting

Metriche endpoint

Metriche per query personalizzate