Modell-Deployment-Metriken

Erfahren Sie, wie Sie Metriken für Modell-Deployments verwenden.

Metriken sind automatisch für alle Data Science-Modell-Deployments verfügbar, die Sie im oci_datascience_modeldeploy-Namespace erstellen. Sie müssen kein Monitoring für OCI-Ressourcen aktivieren, um diese Metriken abzurufen.

Metriken zu Data Science-Modell-Deployments umfassen die folgenden Dimensionen:

resourceId

Die OCID des Modell-Deployments.

statusCode

Der HTTP-Antwortstatuscode.

result

Ergebnis der Antwort:

Success
Failure

statusFamily

Statusfamilie des Ergebnisses:

Success: 2XX
Failure: 4XX and 5XX

instanceId

Die ID der Instanz.

networkType

Netzwerktypen:

BytesIn: Network receive throughput
BytesOut: Network transmission throughput

modelOcid

Die OCID des Modells in der bereitgestellten Modellgruppe. Sie können die modellspezifischen Vorhersageanforderungslogs basierend auf der modelOcid am Modellrouter herausfiltern.


Metriknamen	Anzeigename	Einheit	Beschreibung	Dimensionen
`PredictRequestCount`	Anzahl Vorhersageanforderungen	Anzahl	Anzahl der Vorhersageanforderungen.	`resourceId`
`PredictResponse`	Vorhersageantwort-Erfolgsrate	Prozent	Erfolgsrate von Vorhersageantworten. Die Berechnung basiert auf der Anzahl der erfolgreichen Vorhersageanforderungen gegenüber der Gesamtanzahl der Vorhersageanforderungen.	`resourceId` `statusCode` `result` `statusFamily`
`PredictResponse`	Vorhersageantwortstatus	Anzahl	Ergebnis und Statuscode der Vorhersageantwort.	`resourceId` `statusCode` `result` `statusFamily`
`PredictLatency`	Vorhersagelatenz	Millisekunden	Latenz von Vorhersageaufrufen.	`resourceId` `result`
`PredictBandwidth`	Vorhersage-Bandbreitenauslastung	Prozent	Bereitgestellte und verbrauchte Bandbreite von Vorhersageanforderungen. Die bereitgestellte Bandbreite ist die vom Kunden erwartete Bandbreite, die beim Erstellen des Modell-Deployments festgelegt wurde. Die verbrauchte Bandbreite ist die aktive Bandbreite, die von allen laufenden Vorhersageanforderungen für eine bestimmte Modell-Deployment-OCID verbraucht wird. Diese Bandbreite wird in Bezug auf die insgesamt bereitgestellte Load-Balancer-Bandbreite bei jeder Vorhersageanforderung als derzeit genutzte Bandbreite berechnet.	`resourceId`
`CpuUtilization`	CPU-Auslastung	Prozent	Aktivitätsebene der CPU.	`resourceId` `instanceId`
`MemoryUtilization`	Speicherauslastung	Prozent	Verwendeter Speicher.	`resourceId` `instanceId`
`NetworkBytes`	Netzwerkempfangs- und -übertragungsvorgänge in Byte	Byte/Sek.	Durchsatz für Netzwerkempfang und -übertragung.	`resourceId` `instanceId` `networkType`
`GPUCoreUtilization`	GPU-Auslastung	Prozent	Zeigt die Auslastung der GPU-Geräte in einem Modell-Deployment-Cluster an.	`resourceId` `instanceId`
`GPUMemoryUtilization`	GPU-Speicherauslastung	Prozent	Zeigt die mittlere Speicherauslastung aller GPU-Geräte in einem Modell-Deployment-Cluster an.	`resourceId` `instanceId`

Modell-Deployment-Metriken anzeigen

Sie können die Standardmetrikdiagramme über eine Modell-Deployment-Detailseite im Data Science-Service anzeigen.

Wählen Sie auf der Seite "Modell-Deployments" den Namen des Modell-Deployments aus, für das die Metriken angezeigt werden sollen. Wenn Sie Hilfe beim Suchen der Liste der Modell-Deployments benötigen, finden Sie weitere Informationen unter Modell-Deployments auflisten.
Wählen Sie unter Ressourcen die Option Metriken aus.
Im Bereich Metriken wird ein Diagramm für jede Metrik angezeigt, die an den Metrik-Namespace für Data Science ausgegeben wird.

Weitere Informationen zu den ausgegebenen Metriken finden Sie unter Modell-Deployment-Metriken.

Wenn die erwarteten Metrikdaten für die Modell-Deployment-Session nicht angezeigt werden, lesen Sie Fehlende Metrikdaten.

Oracle Cloud Infrastructure - Dokumentation

Modell-Deployment-Metriken

Modell-Deployment-Metriken anzeigen