Mesures de déploiement de modèles
Découvrez comment utiliser des mesures pour les déploiements de modèle.
Les mesures sont automatiquement disponibles pour tous les déploiements de modèle du service de science des données de données que vous créez dans l'espace de noms oci_datascience_modeldeploy
. Il n'est pas nécessaire d'activer la surveillance des ressources OCI pour obtenir ces mesures.
Les mesures de déploiement de modèle du service Science des données comprennent ces dimensions :
- resourceId
-
OCID du déploiement de modèle.
- statusCode
-
Code de statut de réponse HTTP.
- result
-
Résultat de la réponse :
-
Success
-
Failure
-
- statusFamily
-
Famille de statuts de résultats :
-
Success: 2XX
-
Failure: 4XX and 5XX
-
- instanceId
-
ID de l'instance.
- networkType
-
Types de réseau :
BytesIn: Network receive throughput
-
BytesOut: Network transmission throughput
Noms de mesure | Nom d'affichage | Unité | Description | Dimensions |
---|---|---|---|---|
PredictRequestCount |
Nombre de demandes de prédiction | Nombre | Nombre de demandes de prédiction. |
|
PredictResponse |
Réponse de prédiction - Taux de réussite | Pourcentage | Taux de réussite des réponses de prédiction. Il est calculé en fonction du nombre de demandes de prédiction réussies sur le nombre total de demandes. |
|
Réponse de prédiction - Statut | Nombre | Résultat de la réponse de prédiction et code de statut. | ||
PredictLatency |
Latence de prédiction | Millisecondes | Latence des appels de prédiction. |
|
PredictBandwidth |
Utilisation de la bande passante de prédiction | Pourcentage |
Bande passante provisionnée et consommée par les prédictions. La bande passante provisionnée est la bande passante attendue du client définie lors de la création du déploiement de modèle. La largeur de bande consommée est la largeur de bande active utilisée par toutes les demandes de prévision en cours pour un OCID de déploiement de modèle spécifique. Cette bande passante est calculée en tant que bande passante consommée courante par rapport à la bande passante totale de l'équilibreur de charge provisionnée sur chaque demande de prédiction. |
|
CpuUtilization |
Utilisation de l'UC | Pourcentage | Niveau d'activité de l'unité centrale. |
|
MemoryUtilization |
Utilisation de la mémoire | Pourcentage | Mémoire en cours d'utilisation. |
|
NetworkBytes |
Octets reçus et transmis sur le réseau | Octets/s | Débit de réception et de transmission du réseau. |
|
GPUCoreUtilization |
Utilisation de GPU | Pourcentage | Indique le niveau d'utilisation des GPU dans une grappe de déploiement de modèle. |
|
GPUMemoryUtilization |
Utilisation de mémoire de GPU | Pourcentage | Indique la consommation moyenne de mémoire de tous les GPU dans une grappe de déploiement de modèle. |
|
Consultation des mesures des déploiements de modèle
Vous pouvez voir les graphiques de mesure par défaut à l'aide de la page des détails de déploiement de modèle du service Science des données.
Pour plus d'informations sur les mesures émises, voir les mesures de déploiement de modèle.
Si les données de mesure attendues pour un déploiement de modèle n'apparaissent pas, voir Données de mesures manquantes.