Modell-Deployment-Metriken
Erfahren Sie, wie Sie Metriken für Modell-Deployments verwenden.
Metriken sind automatisch für alle Data Science-Modellbereitstellungen verfügbar, die Sie im Namespace oci_datascience_modeldeploy
erstellen. Sie müssen kein Monitoring für OCI-Ressourcen aktivieren, um diese Metriken abzurufen.
Metriken zu Data Science-Modell-Deployments umfassen die folgenden Dimensionen:
- resourceId
-
Die OCID des Modell-Deployments.
- statusCode
-
Der HTTP-Antwortstatuscode.
- result
-
Ergebnis der Antwort:
-
Success
-
Failure
-
- statusFamily
-
Statusfamilie des Ergebnisses:
-
Success: 2XX
-
Failure: 4XX and 5XX
-
- instanceId
-
Die ID der Instanz.
- networkType
-
Netzwerktypen:
BytesIn: Network receive throughput
-
BytesOut: Network transmission throughput
Metriknamen | Anzeigename | Einheit | Beschreibung | Dimensionen |
---|---|---|---|---|
PredictRequestCount |
Anzahl Vorhersageanforderungen | Anzahl | Anzahl der Vorhersageanforderungen. |
|
PredictResponse |
Vorhersageantwort-Erfolgsrate | Prozent | Erfolgsrate von Vorhersageantworten. Die Berechnung basiert auf der Anzahl der erfolgreichen Vorhersageanforderungen gegenüber der Gesamtanzahl der Vorhersageanforderungen. |
|
Vorhersageantwortstatus | Anzahl | Ergebnis und Statuscode der Vorhersageantwort. | ||
PredictLatency |
Vorhersagelatenz | Millisekunden | Latenz von Vorhersageaufrufen. |
|
PredictBandwidth |
Vorhersage-Bandbreitenauslastung | Prozent |
Bereitgestellte und verbrauchte Bandbreite von Vorhersageanforderungen. Die bereitgestellte Bandbreite ist die vom Kunden erwartete Bandbreite, die beim Erstellen des Modell-Deployments festgelegt wurde. Die verbrauchte Bandbreite ist die aktive Bandbreite, die von allen laufenden Vorhersageanforderungen für eine bestimmte Modell-Deployment-OCID verbraucht wird. Diese Bandbreite wird in Bezug auf die insgesamt bereitgestellte Load-Balancer-Bandbreite bei jeder Vorhersageanforderung als derzeit genutzte Bandbreite berechnet. |
|
CpuUtilization |
CPU-Auslastung | Prozent | Aktivitätsebene der CPU. |
|
MemoryUtilization |
Speicherauslastung | Prozent | Verwendeter Speicher. |
|
NetworkBytes |
Netzwerkempfangs- und -übertragungsvorgänge in Byte | Byte/Sek. | Durchsatz für Netzwerkempfang und -übertragung. |
|
GPUCoreUtilization |
GPU-Auslastung | Prozent | Zeigt die Auslastung der GPU-Geräte in einem Modell-Deployment-Cluster an. |
|
GPUMemoryUtilization |
GPU-Speicherauslastung | Prozent | Zeigt die mittlere Speicherauslastung aller GPU-Geräte in einem Modell-Deployment-Cluster an. |
|
Modell-Deployment-Metriken anzeigen
Sie können die Standardmetrikdiagramme über eine Modell-Deployment-Detailseite im Data Science-Service anzeigen.
Weitere Informationen zu den ausgegebenen Metriken finden Sie unter Modell-Deployment-Metriken.
Wenn die erwarteten Metrikdaten für die Modell-Deployment-Session nicht angezeigt werden, lesen Sie Fehlende Metrikdaten.