Mesures de déploiement de modèles

Découvrez comment utiliser des mesures pour les déploiements de modèle.

Les mesures sont automatiquement disponibles pour tous les déploiements de modèle du service de science des données de données que vous créez dans l'espace de noms oci_datascience_modeldeploy. Il n'est pas nécessaire d'activer la surveillance des ressources OCI pour obtenir ces mesures.

Les mesures de déploiement de modèle du service Science des données comprennent ces dimensions :

resourceId

OCID du déploiement de modèle.

statusCode

Code de statut de réponse HTTP.

result

Résultat de la réponse :

Success
Failure

statusFamily

Famille de statuts de résultats :

Success: 2XX
Failure: 4XX and 5XX

instanceId

ID de l'instance.

networkType

Types de réseau :

BytesIn: Network receive throughput
BytesOut: Network transmission throughput

modelOcid

OCID du modèle dans le groupe de modèles déployé. Vous pouvez filtrer les journaux de demande de prédiction propres au modèle en fonction de modelOcid au niveau du routeur de modèle.


Noms de mesure	Nom d'affichage	Unité	Description	Dimensions
`PredictRequestCount`	Nombre de demandes de prédiction	Nombre	Nombre de demandes de prédiction.	`resourceId`
`PredictResponse`	Réponse de prédiction - Taux de réussite	Pourcentage	Taux de réussite des réponses de prédiction. Il est calculé en fonction du nombre de demandes de prédiction réussies sur le nombre total de demandes.	`resourceId` `statusCode` `result` `statusFamily`
`PredictResponse`	Réponse de prédiction - Statut	Nombre	Résultat de la réponse de prédiction et code de statut.	`resourceId` `statusCode` `result` `statusFamily`
`PredictLatency`	Latence de prédiction	Millisecondes	Latence des appels de prédiction.	`resourceId` `result`
`PredictBandwidth`	Utilisation de la bande passante de prédiction	Pourcentage	Bande passante provisionnée et consommée par les prédictions. La bande passante provisionnée est la bande passante attendue du client définie lors de la création du déploiement de modèle. La largeur de bande consommée est la largeur de bande active utilisée par toutes les demandes de prévision en cours pour un OCID de déploiement de modèle spécifique. Cette bande passante est calculée en tant que bande passante consommée courante par rapport à la bande passante totale de l'équilibreur de charge provisionnée sur chaque demande de prédiction.	`resourceId`
`CpuUtilization`	Utilisation de l'UC	Pourcentage	Niveau d'activité de l'unité centrale.	`resourceId` `instanceId`
`MemoryUtilization`	Utilisation de la mémoire	Pourcentage	Mémoire en cours d'utilisation.	`resourceId` `instanceId`
`NetworkBytes`	Octets reçus et transmis sur le réseau	Octets/s	Débit de réception et de transmission du réseau.	`resourceId` `instanceId` `networkType`
`GPUCoreUtilization`	Utilisation de GPU	Pourcentage	Indique le niveau d'utilisation des GPU dans une grappe de déploiement de modèle.	`resourceId` `instanceId`
`GPUMemoryUtilization`	Utilisation de mémoire de GPU	Pourcentage	Indique la consommation moyenne de mémoire de tous les GPU dans une grappe de déploiement de modèle.	`resourceId` `instanceId`

Consultation des mesures des déploiements de modèle

Vous pouvez voir les graphiques de mesure par défaut à l'aide de la page des détails de déploiement de modèle du service Science des données.

Dans la page des déploiements de modèle, sélectionnez le nom du déploiement de modèle pour lequel consulter les mesures. Si vous avez besoin d'aide pour trouver la liste des déploiements de modèle, voir Liste des déploiements de modèle.
Sous Ressources, sélectionnez Mesures.
La zone Mesures affiche un graphique pour chaque mesure émise pour l'espace de noms de mesure du service de science des données.

Pour plus d'informations sur les mesures émises, voir les mesures de déploiement de modèle.

Si les données de mesure attendues pour un déploiement de modèle n'apparaissent pas, voir Données de mesures manquantes.

Documentation sur Oracle Cloud Infrastructure

Mesures de déploiement de modèles

Consultation des mesures des déploiements de modèle