Mesures de déploiement de modèles

Découvrez comment utiliser des mesures pour les déploiements de modèle.

Les mesures sont automatiquement disponibles pour tous les déploiements de modèle du service de science des données de données que vous créez dans l'espace de noms oci_datascience_modeldeploy. Il n'est pas nécessaire d'activer la surveillance des ressources OCI pour obtenir ces mesures.

Les mesures de déploiement de modèle du service Science des données comprennent ces dimensions :

resourceId

OCID du déploiement de modèle.

statusCode

Code de statut de réponse HTTP.

result

Résultat de la réponse :

  • Success

  • Failure

statusFamily

Famille de statuts de résultats :

  • Success: 2XX

  • Failure: 4XX and 5XX

instanceId

ID de l'instance.

networkType

Types de réseau :

  • BytesIn: Network receive throughput
  • BytesOut: Network transmission throughput

Noms de mesure Nom d'affichage Unité Description Dimensions
PredictRequestCount Nombre de demandes de prédiction Nombre Nombre de demandes de prédiction.

resourceId

PredictResponse Réponse de prédiction - Taux de réussite Pourcentage Taux de réussite des réponses de prédiction. Il est calculé en fonction du nombre de demandes de prédiction réussies sur le nombre total de demandes.

resourceId

statusCode

result

statusFamily

Réponse de prédiction - Statut Nombre Résultat de la réponse de prédiction et code de statut.
PredictLatency Latence de prédiction Millisecondes Latence des appels de prédiction.

resourceId

result

PredictBandwidth Utilisation de la bande passante de prédiction Pourcentage

Bande passante provisionnée et consommée par les prédictions. La bande passante provisionnée est la bande passante attendue du client définie lors de la création du déploiement de modèle. La largeur de bande consommée est la largeur de bande active utilisée par toutes les demandes de prévision en cours pour un OCID de déploiement de modèle spécifique. Cette bande passante est calculée en tant que bande passante consommée courante par rapport à la bande passante totale de l'équilibreur de charge provisionnée sur chaque demande de prédiction.

resourceId

CpuUtilization Utilisation de l'UC Pourcentage Niveau d'activité de l'unité centrale.

resourceId

instanceId

MemoryUtilization Utilisation de la mémoire Pourcentage Mémoire en cours d'utilisation.

resourceId

instanceId

NetworkBytes Octets reçus et transmis sur le réseau Octets/s Débit de réception et de transmission du réseau.

resourceId

instanceId

networkType

GPUCoreUtilization Utilisation de GPU Pourcentage Indique le niveau d'utilisation des GPU dans une grappe de déploiement de modèle.

resourceId

instanceId

GPUMemoryUtilization Utilisation de mémoire de GPU Pourcentage Indique la consommation moyenne de mémoire de tous les GPU dans une grappe de déploiement de modèle.

resourceId

instanceId

Consultation des mesures des déploiements de modèle

Vous pouvez voir les graphiques de mesure par défaut à l'aide de la page des détails de déploiement de modèle du service Science des données.

  1. Dans la page des déploiements de modèle, sélectionnez le nom du déploiement de modèle pour lequel consulter les mesures. Si vous avez besoin d'aide pour trouver la liste des déploiements de modèle, voir Liste des déploiements de modèle.
  2. Sous Ressources, sélectionnez Mesures.

    La zone Mesures affiche un graphique pour chaque mesure émise pour l'espace de noms de mesure du service de science des données.

Pour plus d'informations sur les mesures émises, voir les mesures de déploiement de modèle.

Si les données de mesure attendues pour un déploiement de modèle n'apparaissent pas, voir Données de mesures manquantes.