Mesures d'instance Compute

Vous pouvez surveiller l'état, la capacité et les performances de vos instances de calcul à l'aide de mesures, d'alarmes et de notifications.

Cette rubrique décrit les mesures émises par l'espace de noms de mesure oci_computeagent (module d'extension de surveillance d'instance de calcul sur les instances de calcul).

Vous pouvez visualiser ces mesures pour des instances de calcul individuelles et pour toutes les instances d'un pool d'instances.

Ressources : instances de calcul pour lesquelles la surveillance est activée.

Présentation des mesures relatives à une instance et des ressources connexes

Cette section donne un aperçu global des différents types de mesure disponibles pour une instance et ses périphériques réseau et de stockage. Reportez-vous au diagramme et au tableau suivants pour obtenir un récapitulatif.

Cette image montre les types de mesure disponibles pour une instance et les composants associés.


Espace de noms de mesure	ID de ressource	Emplacement de la mesure	Mesures disponibles
`oci_computeagent`	OCID d'instance	Sur l'instance. Les mesures de cet espace de noms sont agrégées pour toutes les ressources associées sur l'instance. Par exemple, `DiskBytesRead` est agrégé pour tous les volumes de stockage attachés de l'instance et `NetworkBytesIn` est agrégé pour toutes les cartes d'interface réseau virtuelles attachées de l'instance.	Reportez-vous à Mesures disponibles : oci_computeagent.
`oci_blockstore`	OCID de volume d'initialisation ou de blocs	Par le service Block Volume. Ces mesures concernent un volume individuel (volume d'initialisation ou volume de blocs).	Reportez-vous à Mesures de Block Volume.
`oci_vcn`	OCID de carte d'interface réseau virtuelle	Par le service Networking. Ces mesures concernent une carte d'interface réseau virtuelle individuelle.	Reportez-vous à Mesures de carte d'interface réseau virtuelle.

Avant de commencer

Stratégies IAM : pour surveiller les ressources, vous devez disposer du type d'accès requis dans une stratégie écrite par un administrateur, que vous utilisiez la console ou l'API REST avec un kit SDK, une CLI ou un autre outil. La stratégie doit vous donner accès aux services de surveillance, ainsi qu'aux ressources surveillées. Si vous essayez d'effectuer une action et qu'un message indique que vous n'y êtes pas autorisé, contactez l'administrateur pour savoir quel type d'accès vous a été accordé et dans quel compartiment vous devez travailler. Pour plus d'informations sur les autorisations utilisateur liées à la surveillance, reportez-vous à Stratégies IAM.
Des mesures existent dans Monitoring : les ressources à surveiller doivent émettre des mesures vers le service Monitoring.
Instances de calcul : pour émettre des mesures, le module d'extension de surveillance des instances de calcul doit être activé sur l'instance et les modules d'extension doivent être en cours d'exécution. L'instance doit également disposer d'une passerelle de service ou d'une adresse IP publique pour envoyer des mesures au service Monitoring. Pour plus d'informations, reportez-vous à Activation de la surveillance pour les instances Compute.

Mesures disponibles : oci_computeagent

Les mesures d'instance de calcul vous aident à mesurer le niveau d'activité et le débit des instances de calcul. Les mesures répertoriées dans le tableau suivant sont disponibles pour toute instance de calcul pour laquelle la surveillance est activée. Pour obtenir ces mesures, activez la surveillance sur l'instance.

Les mesures de cet espace de noms sont agrégées pour toutes les ressources associées sur l'instance. Par exemple, DiskBytesRead est agrégé pour tous les volumes de stockage attachés de l'instance et NetworkBytesIn est agrégé pour toutes les cartes d'interface réseau virtuelles attachées de l'instance.

Pour les mesures émises par l'espace de noms de mesure oci_computeagent, les points de données sont échantillonnés toutes les dix secondes. Un lot de six points de données est émis toutes les minutes. Par conséquent, pour chaque minute, le décompte agrégé est toujours six, la somme agrégée est la somme des six points de données et la moyenne agrégée correspond à la moyenne des six points de données.

Vous pouvez également utiliser le service Monitoring pour créer des requêtes personnalisées.

Chaque mesure inclut les dimensions suivantes :

availabilityDomain: Domaine de disponibilité dans lequel réside l'instance.
faultDomain: Domaine de pannes dans lequel l'instance réside.
imageId: OCID de l'image de l'instance.
instancePoolId: Pool d'instances auquel appartient l'instance.
region: Région dans laquelle réside l'instance.
resourceDisplayName: Nom convivial de l'instance.
resourceId: OCID de l'instance.
shape: Forme de l'instance.


Mesure	Nom d'affichage de mesure	Unité	Description	Dimensions
`CpuUtilization`	Utilisation de l'UC	pourcentage	Niveau d'activité de l'UC. Exprimé en pourcentage du temps total. Pour les pools d'instances, la valeur moyenne est calculée pour toutes les instances du pool.	`availabilityDomain` `faultDomain` `imageId` `instancePoolId` `region` `resourceDisplayName` `resourceId` `shape`
`DiskBytesRead`^1, ³	Octets de lecture sur disque	octets	Débit de lecture. Exprimé en octets lus par intervalle.
`DiskBytesWritten`^1, ³	Octets d'écriture sur disque	octets	Débit d'écriture. Exprimé en octets écrits par intervalle.
`DiskIopsRead`^1, ³	E/S de lecture sur disque	opérations	Niveau d'activité à partir des lectures d'E/S. Exprimé en lectures par intervalle.
`DiskIopsWritten`^1, ³	E/S d'écriture sur disque	opérations	Niveau d'activité à partir des écritures d'E/S. Exprimé en écritures par intervalle.
`LoadAverage`	Charge moyenne	nombre de processus	Charge système moyenne calculée sur une période d'une minute.
`MemoryAllocationStalls`	Arrêts d'allocation de mémoire	nombre d'arrêts	Nombre de fois où une réclamation de page a été directement appelée.
`MemoryUtilization`¹	Utilisation de la mémoire	pourcentage	Espace en cours d'utilisation. Mesuré en pages. Exprimé en pourcentage de pages utilisées. Pour les pools d'instances, la valeur moyenne est calculée pour toutes les instances du pool.
`NetworksBytesIn`^1, ²	Octets de réception réseau	octets	Débit de réception réseau. Exprimé en octets reçus.
`NetworksBytesOut`^1, ²	Octets de transmission réseau	octets	Débit de transmission réseau. Exprimé en octets transmis.
¹Cette mesure est un compteur cumulatif qui indique un comportement à croissance monotone pour chaque session du logiciel d'agent Oracle Cloud, avec une réinitialisation lorsque le système d'exploitation est redémarré. ²Le service Networking fournit des mesures supplémentaires (dans l'espace de noms de mesure `oci_vcn`) pour chaque carte d'interface réseau virtuelle de l'instance. Pour plus d'informations, reportez-vous à Mesures de Networking. ³Le service Block Volume fournit des mesures supplémentaires (dans l'espace de noms de mesure `oci_blockstore`) pour chaque volume attaché à l'instance. Pour plus d'informations, reportez-vous à Mesures de Block Volume.

Mesures disponibles : gpu_infrastructure_health

Pour les mesures émises par l'espace de noms de mesure gpu_infrastructure_health, les points de données sont échantillonnés toutes les dix secondes. Un lot de six points de données est émis toutes les minutes. Par conséquent, pour chaque minute, le décompte agrégé est toujours six, la somme agrégée est la somme des six points de données et la moyenne agrégée correspond à la moyenne des six points de données.

Vous pouvez également utiliser le service Monitoring pour créer des requêtes personnalisées.

Chaque mesure inclut les dimensions suivantes :

composant: GPU ou rdma_nic
horodatage: Heure UTC d'émission de la charge utile/du signal d'activité
version: Numéro de version de la charge utile pour la compatibilité


Mesure	Nom d'affichage de mesure	Unité	Description	Dimensions
`GpuUtilization`	Utilisation de GPU	pourcentage	Niveau d'activité du GPU. Exprimé en pourcentage du temps total. Pour les pools d'instances, la valeur moyenne est calculée pour toutes les instances du pool.	`availabilityDomain` `faultDomain` `gpuId` `imageId` `instancePoolId` `region` `resourceDisplayName` `resourceId` `shape`
`GpuMemoryUtilization`	Utilisation de la mémoire GPU	pourcentage	Pourcentage de la ressource de mémoire GPU utilisée.
`GpuPowerDraw`	Consommation d'énergie de GPU	entier	Quantité d'énergie GPU utilisée.
`GpuTemperature`	Température de GPU	entier	Température du GPU signalée.
`GpuEccSingleBitErrors`	Erreurs simple-bit de GPU	entier	Nombre d'erreurs ECC monobit GPU signalées.
`GpuEccDoubleBitErrors`	Erreurs double-bit de GPU	entier	Nombre d'erreurs ECC de double bit de GPU signalées.
¹Cette mesure est un compteur cumulatif qui indique un comportement à croissance monotone pour chaque session du logiciel d'agent Oracle Cloud, avec une réinitialisation lorsque le système d'exploitation est redémarré. ²Le service Networking fournit des mesures supplémentaires (dans l'espace de noms de mesure `oci_vcn`) pour chaque carte d'interface réseau virtuelle de l'instance. Pour plus d'informations, reportez-vous à Mesures de Networking. ³Le service Block Volume fournit des mesures supplémentaires (dans l'espace de noms de mesure `oci_blockstore`) pour chaque volume attaché à l'instance. Pour plus d'informations, reportez-vous à Mesures de Block Volume.

Mesures disponibles : rdma_infrastructure_health

Pour les mesures émises par l'espace de noms de mesure rdma_infrastructure_health, les points de données sont échantillonnés toutes les dix secondes. Un lot de six points de données est émis toutes les minutes. Par conséquent, pour chaque minute, le décompte agrégé est toujours six, la somme agrégée est la somme des six points de données et la moyenne agrégée correspond à la moyenne des six points de données.

Vous pouvez également utiliser le service Monitoring pour créer des requêtes personnalisées.

Chaque mesure inclut les dimensions suivantes :

composant: GPU ou rdma_nic
horodatage: Heure UTC d'émission de la charge utile/du signal d'activité
version: Numéro de version de la charge utile pour la compatibilité


Mesure	Nom d'affichage de mesure	Unité	Description	Dimensions
`RdmaTxBytes`	octets agrégés de transmission réseau RDMA	octets	octets transmis sur l'interface RDMA.	`availabilityDomain` `faultDomain` `imageId` `instancePoolId` `rdmaId` `region` `resourceDisplayName` `resourceId` `shape`
`RdmaRxBytes`	octets agrégés de réception réseau RDMA	octets	octets reçus sur l'interface RDMA.
`RdmaTxPackets`	Paquets de transmission réseau agrégés RDMA	entier	Nombre de paquets d'interface RDMA transmis.
`RdmaRxPackets`	Paquets de réception réseau agrégés RDMA	entier	Nombre de paquets d'interface RDMA reçus.
¹Cette mesure est un compteur cumulatif qui indique un comportement à croissance monotone pour chaque session du logiciel d'agent Oracle Cloud, avec une réinitialisation lorsque le système d'exploitation est redémarré. ²Le service Networking fournit des mesures supplémentaires (dans l'espace de noms de mesure `oci_vcn`) pour chaque carte d'interface réseau virtuelle de l'instance. Pour plus d'informations, reportez-vous à Mesures de Networking. ³Le service Block Volume fournit des mesures supplémentaires (dans l'espace de noms de mesure `oci_blockstore`) pour chaque volume attaché à l'instance. Pour plus d'informations, reportez-vous à Mesures de Block Volume.

Utilisation de la console

Procédure de visualisation des graphiques de mesures pour une instance de calcul unique

Ouvrez le menu de navigation et cliquez sur Compute. Sous Compute, cliquez sur Instances.
Cliquez sur l'instance qui vous intéresse.
Sous Ressources, cliquez sur Mesures.

Dans la liste Espace de noms de mesure, sélectionnez oci_computeagent.

La page Mesures affiche un ensemble de graphiques par défaut pour l'instance en cours.

Aucun graphique de mesures n'apparaît pour l'instance ?

Si aucun graphique de mesures n'apparaît, l'instance n'émet peut-être pas de mesures. Reportez-vous aux causes possibles et aux résolutions suivantes.


Cause possible	Vérification	Résolution
Le module d'extension de surveillance des instances de calcul est désactivé sur l'instance ou des modules d'extension sont arrêtés.	Vérifiez les propriétés de l'instance.	Activez le module d'extension de surveillance des instances de calcul et démarrez tous les modules d'extension.
L'instance ne peut pas accéder au service Monitoring car son VCN n'utilise pas Internet.	Vérifiez l'adresse IP de l'instance. Si elle n'est pas publique, une passerelle de service est nécessaire.	Configurez une passerelle de service.
L'instance n'utilise pas une image prise en charge.	Vérifiez les images prises en charge.	Créez une instance avec une image prise en charge.
Images plus anciennes et images personnalisées : aucun logiciel d'agent Oracle Cloud n'existe sur l'instance.	Connectez-vous à l'instance et recherchez le logiciel.	Installez le logiciel d'agent Oracle Cloud.
Le logiciel d'agent Oracle Cloud pose un autre problème.	(non applicable)	Suivez les étapes de dépannage de l'agent Oracle Cloud.

Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, reportez-vous à Présentation de Monitoring. Pour plus d'informations sur les notifications relatives aux alarmes, reportez-vous à Présentation de Notifications.

Procédure de visualisation des graphiques de mesures par défaut pour les ressources associées à une instance de calcul

Pour un volume de blocs attaché : lorsque vous visualisez les détails de l'instance, sous Ressources, cliquez sur Volumes de blocs attachés, puis sur le volume qui vous intéresse. Sous Ressources, cliquez sur Mesures pour visualiser les graphiques du volume. Pour plus d'informations sur les mesures émises, reportez-vous à Mesures de Block Volume.
Pour le volume d'initialisation attaché : lorsque vous visualisez les détails de l'instance, sous Ressources, cliquez sur Volume d'initialisation, puis sur le volume qui vous intéresse. Sous Ressources, cliquez sur Mesures pour visualiser les graphiques du volume. Pour plus d'informations sur les mesures émises, reportez-vous à Mesures de Block Volume.
Pour une carte d'interface réseau virtuelle attachée : lorsque vous visualisez les détails de l'instance, sous Ressources, cliquez sur VNIC attachées, puis sur la carte d'interface réseau virtuelle qui vous intéresse. Sous Ressources, cliquez sur Mesures pour afficher les graphiques de la carte d'interface réseau virtuelle. Pour plus d'informations sur les mesures émises, reportez-vous à Mesures de Networking.

Procédure de visualisation des graphiques de mesures par défaut pour toutes les instances de calcul d'un compartiment

Ouvrez le menu de navigation et cliquez sur Observability and Management. Sous Surveillance, cliquez sur Mesures de service.
Sélectionnez un compartiment.
Pour Espace de noms de mesure, sélectionnez oci_computeagent.

La page Mesures de service est mise à jour de façon dynamique afin d'afficher les graphiques de chaque mesure émise par l'espace de noms de mesure sélectionné.

Procédure de visualisation des graphiques de mesures par défaut des instances d'un pool

Ouvrez le menu de navigation et cliquez sur Compute. Sous Compute, cliquez sur Pools d'instances.
Cliquez sur le pool d'instances qui vous intéresse.
Sous Ressources, cliquez sur Mesures.
Dans la liste Espace de noms de mesure, sélectionnez oci_computeagent.

La page Mesures affiche un ensemble de graphiques par défaut pour le pool d'instances en cours.

Utilisation de l'API

Pour plus d'informations sur l'utilisation de l'API et la signature des demandes, reportez-vous à la documentation relative à l'API REST et à Informations d'identification de sécurité. Pour plus d'informations sur les kits SDK, reportez-vous à Kits SDK et interface de ligne de commande.

Utilisez les API suivantes pour la surveillance :

API Monitoring pour les mesures et les alarmes
API Notifications pour les notifications (utilisée avec des alarmes)

Documentation Oracle Cloud Infrastructure

Mesures d'instance Compute

Présentation des mesures relatives à une instance et des ressources connexes

Avant de commencer

Mesures disponibles : oci_computeagent

Mesures disponibles : gpu_infrastructure_health

Mesures disponibles : rdma_infrastructure_health

Utilisation de la console

Utilisation de l'API