Metriche negli agenti AI generativa

Utilizzando le metriche, puoi monitorare gli endpoint negli agenti AI generativi. Per ulteriori informazioni su queste metriche, vedere i seguenti argomenti.

Metriche di endpoint

In questa sezione vengono elencate le metriche per gli endpoint agente negli agenti AI generativi. È possibile ottenere le metriche riportate di seguito nella pagina dei dettagli di un endpoint.

Nome visualizzato metrica descrizione;
Numero di chiamate Numero di chiamate elaborate dall'agente ospitato su questo endpoint
Tempo di elaborazione totale (ms) Tempo totale di elaborazione per il completamento di una chiamata in millisecondi
Conteggio errori servizio Numero di chiamate con un errore dal lato servizio
Conteggio errori client Numero di chiamate con un errore dal lato client
Totale caratteri di input consumati Numero di caratteri di input elaborati dall'agente ospitato in questo endpoint
Totale caratteri di output prodotti Numero di caratteri di output elaborati dall'agente ospitato in questo endpoint
Numero di trace di errore Numero di trace con un errore (questa opzione si applica se il trace è abilitato per questo endpoint).
Tasso di successo Chiamate riuscite divise per il numero totale di chiamate
Suggerimento

Nel servizio Agenti AI generativi, pagina dei dettagli di un endpoint, selezionare il menu Opzioni in ciascuno dei grafici delle metriche degli endpoint per ottenere le opzioni riportate di seguito.
  • Visualizza query in Metrics Explorer
  • Copia URL del grafico
  • Copia query nel linguaggio MQL (Monitoring Query Language)
  • Crea un allarme in questa query
  • Vista tabella

Visualizzazione della query in Metrics Explorer

L'Explorer delle metriche è una risorsa nel servizio di monitoraggio. Per ottenere l'autorizzazione per utilizzare le risorse del servizio di monitoraggio, chiedere a un amministratore di esaminare i criteri IAM in Protezione del monitoraggio e concedere l'accesso appropriato per il proprio ruolo.

Per ciascuna delle metriche dell'endpoint, selezionare il menu Opzioni in ciascuno dei grafici delle metriche dell'endpoint, quindi selezionare Visualizza query in Metrics Explorer Nella tabella riportata di seguito vengono visualizzati i parametri utilizzati per le metriche dell'endpoint in Monitoring Query Language (MQL).

Nome visualizzato metrica Parametro metrica MQL
Numero di chiamate TotalInvocationCount TotalInvocationCount[1m].count()
Tempo di elaborazione totale InvocationLatency InvocationLatency[1m].mean()
Conteggio errori servizio ServerErrorCount ServerErrorCount[1m].count()
Conteggio errori client ClientErrorCount ClientErrorCount[1m].count()
Totale caratteri di input consumati InputCharactersCount InputCharactersCount[1m].sum()
Totale caratteri di output prodotti OutputCharactersCount[1m].sum() OutputCharactersCount[1m].sum()
Numero di trace di errore ErrorTraceCount ErrorTraceCount[1m].sum()

Il tasso di successo viene calcolato come chiamate riuscite diviso per il numero totale di chiamate con il seguente MQL:

TotalInvocationCount[1m]{resourceId = "<endpoint-OCID>", StatusCode="200"}.grouping().count()
/ TotalInvocationCount[1m]{resourceId = "<endpoint-OCID>"}.grouping().count() * 100

Creazione di un allarme per una metrica endpoint

Per ciascuna metrica dell'endpoint, selezionare il menu Opzioni in ciascuno dei grafici delle metriche dell'endpoint. Selezionare quindi Crea un allarme in questa query da trasportare in una pagina Crea allarme popolata nel servizio di monitoraggio. Compilare i campi rimanenti per impostare un allarme per la metrica selezionata.