Metriche distribuzione modello
Informazioni su come utilizzare le metriche per le distribuzioni dei modelli.
Le metriche sono automaticamente disponibili per qualsiasi distribuzione di modelli di Data Science creata nello spazio di nomi oci_datascience_modeldeploy
. Non è necessario abilitare il monitoraggio sulle risorse OCI per ottenere queste metriche.
I parametri delle distribuzioni dei modelli di Data Science includono le dimensioni riportate di seguito.
- resourceId
-
OCID della distribuzione del modello.
- statusCode
-
Codice dello stato di risposta HTTP.
- result
-
Risultato della risposta:
-
Success
-
Failure
-
- statusFamily
-
Famiglia di risultati stato:
-
Success: 2XX
-
Failure: 4XX and 5XX
-
- instanceId
-
L'ID dell'istanza.
- networkType
-
Tipi di rete:
BytesIn: Network receive throughput
-
BytesOut: Network transmission throughput
Nomi metriche | Nome visualizzato | Unità | descrizione; | Dimensioni |
---|---|---|---|---|
PredictRequestCount |
Prevedi conteggio richieste | Count | Numero di richieste di previsione. |
|
PredictResponse |
Risposta di previsione - Tasso di successo | Percentuale. | Risposta di previsione. Viene calcolato in base al numero di richieste di previsione riuscite rispetto al numero totale di richieste di previsione. |
|
Risposta di previsione | Count | Prevedi il risultato della risposta e il codice di stato. | ||
PredictLatency |
Prevedi latenza | Millisecondi | Latenza di previsione delle chiamate. |
|
PredictBandwidth |
Prevedi utilizzo larghezza di banda | Percentuale. |
Prevedi la larghezza di banda di cui è stato eseguito il provisioning e utilizzata. La larghezza di banda di cui è stato eseguito il provisioning è la larghezza di banda prevista dal cliente impostata durante la creazione della distribuzione del modello. La larghezza di banda utilizzata è la larghezza di banda attiva utilizzata da tutte le richieste di previsione in corso per un OCID di distribuzione modello specifico. Questa larghezza di banda viene calcolata come larghezza di banda consumata corrente rispetto alla larghezza di banda del load balancer di cui è stato eseguito il provisioning totale in ogni richiesta di previsione. |
|
CpuUtilization |
Utilizzo CPU | Percentuale. | Livello di attività della CPU. |
|
MemoryUtilization |
Utilizzo memoria | Percentuale. | Memoria in uso. |
|
NetworkBytes |
Byte di ricezione e trasmissione della rete | Byte/sec | Throughput di ricezione e trasmissione della rete. |
|
GPUCoreUtilization |
Utilizzo GPU | Percentuale. | Mostra quanto sono occupati i dispositivi GPU in un cluster di distribuzione modello. |
|
GPUMemoryUtilization |
Utilizzo della memoria GPU | Percentuale. | Mostra il consumo medio di memoria di tutti i dispositivi GPU in un cluster di distribuzione modello. |
|
Visualizzazione delle metriche di distribuzione del modello
È possibile visualizzare i grafici delle metriche predefiniti utilizzando una pagina dei dettagli di distribuzione del modello nel servizio Data Science.
Per ulteriori informazioni sulle metriche emesse, vedere Metriche di distribuzione dei modelli.
Se non vengono visualizzati i dati delle metriche per la sessione di distribuzione del modello prevista, vedere Dati delle metriche mancanti.