Mesures d'instance Compute

Vous pouvez surveiller l'état, la capacité et les performances de vos instances de calcul à l'aide de mesures, d'alarmes et de notifications.

Cette rubrique décrit les mesures émises par l'espace de noms de mesure oci_computeagent (module d'extension de surveillance d'instance de calcul sur les instances de calcul).

Vous pouvez visualiser ces mesures pour des instances de calcul individuelles et pour toutes les instances d'un pool d'instances.

Ressources : instances de calcul  pour lesquelles la surveillance est activée.

Présentation des mesures relatives à une instance et des ressources connexes

Cette section donne un aperçu global des différents types de mesure disponibles pour une instance et ses périphériques réseau et de stockage. Reportez-vous au diagramme et au tableau suivants pour obtenir un récapitulatif.

Cette image montre les types de mesure disponibles pour une instance et les composants associés.

Espace de noms de mesure ID de ressource Emplacement de la mesure Mesures disponibles
oci_computeagent OCID d'instance Sur l'instance. Les mesures de cet espace de noms sont agrégées pour toutes les ressources associées sur l'instance. Par exemple, DiskBytesRead est agrégé pour tous les volumes de stockage attachés de l'instance et NetworkBytesIn est agrégé pour toutes les cartes d'interface réseau virtuelles attachées de l'instance.

Reportez-vous à Mesures disponibles : oci_computeagent.

oci_blockstore OCID de volume d'initialisation ou de blocs Par le service Block Volume. Ces mesures concernent un volume individuel (volume d'initialisation ou volume de blocs). Reportez-vous à Mesures de Block Volume.
oci_vcn OCID de carte d'interface réseau virtuelle Par le service Networking. Ces mesures concernent une carte d'interface réseau virtuelle individuelle.

Reportez-vous à Mesures de carte d'interface réseau virtuelle.

Avant de commencer

  • Stratégies IAM : pour surveiller les ressources, vous devez disposer du type d'accès requis dans une stratégie écrite par un administrateur, que vous utilisiez la console ou l'API REST avec un kit SDK, une interface de ligne de commande ou un autre outil. La stratégie doit vous donner accès aux services de surveillance, ainsi qu'aux ressources surveillées. Si vous essayez d'effectuer une action et qu'un message indique que vous n'y avez pas d'autorisation ou non, contactez l'administrateur pour déterminer le type d'accès qui vous a été accordé et le compartiment dans lequel vous devez travailler. Pour plus d'informations sur les autorisations utilisateur liées à la surveillance, reportez-vous à Stratégies IAM.
  • Des mesures existent dans Monitoring : les ressources à surveiller doivent émettre des mesures vers le service Monitoring.
  • Instances de calcul : pour émettre des mesures, le module d'extension de surveillance des instances de calcul doit être activé sur l'instance et les modules d'extension doivent être en cours d'exécution. L'instance doit également disposer d'une passerelle de service ou d'une adresse IP publique pour envoyer des mesures au service Monitoring. Pour plus d'informations, reportez-vous à Activation de la surveillance pour les instances Compute.

Mesures disponibles : oci_computeagent

Les mesures d'instance de calcul vous aident à mesurer le niveau d'activité et le débit des instances de calcul. Les mesures répertoriées dans le tableau suivant sont disponibles pour toute instance de calcul pour laquelle la surveillance est activée. Pour obtenir ces mesures, activez la surveillance sur l'instance.

Les mesures de cet espace de noms sont agrégées pour toutes les ressources associées sur l'instance. Par exemple, DiskBytesRead est agrégé pour tous les volumes de stockage attachés de l'instance et NetworkBytesIn est agrégé pour toutes les cartes d'interface réseau virtuelles attachées de l'instance.

Pour les mesures émises par l'espace de noms de mesure oci_computeagent, les points de données sont échantillonnés toutes les dix secondes. Un lot de six points de données est émis toutes les minutes. Par conséquent, pour chaque minute, le décompte agrégé est toujours six, la somme agrégée est la somme des six points de données et la moyenne agrégée correspond à la moyenne des six points de données.

Vous pouvez également utiliser le service Monitoring pour créer des requêtes personnalisées.

Chaque mesure inclut les dimensions  suivantes :

availabilityDomain
Domaine de disponibilité dans lequel réside l'instance.
faultDomain
Domaine de pannes dans lequel l'instance réside.
imageId
OCID de l'image  de l'instance.
instancePoolId
Pool d'instances auquel appartient l'instance.
region
Région  dans laquelle réside l'instance.
resourceDisplayName
Nom convivial de l'instance.
resourceId
OCID  de l'instance.
shape
Forme  de l'instance.
Mesure Nom d'affichage de mesure Unité Description Dimensions
CpuUtilization Utilisation de l'UC pourcentage

Niveau d'activité de l'UC. Exprimé en pourcentage du temps total.

Pour les pools d'instances, la valeur moyenne est calculée pour toutes les instances du pool.

availabilityDomain

faultDomain

imageId

instancePoolId

region

resourceDisplayName

resourceId

shape

DiskBytesRead1, 3 Octets de lecture sur disque octets Débit de lecture. Exprimé en octets lus par intervalle.
DiskBytesWritten1, 3 Octets d'écriture sur disque octets Débit d'écriture. Exprimé en octets écrits par intervalle.
DiskIopsRead1, 3 E/S de lecture sur disque opérations Niveau d'activité à partir des lectures d'E/S. Exprimé en lectures par intervalle.
DiskIopsWritten1, 3 E/S d'écriture sur disque opérations Niveau d'activité à partir des écritures d'E/S. Exprimé en écritures par intervalle.
LoadAverage Charge moyenne nombre de processus Charge système moyenne calculée sur une période d'une minute.
MemoryAllocationStalls Arrêts d'allocation de mémoire nombre d'arrêts Nombre de fois où une réclamation de page a été directement appelée.
MemoryUtilization1 Utilisation de la mémoire pourcentage

Espace en cours d'utilisation. Mesuré en pages. Exprimé en pourcentage de pages utilisées.

Pour les pools d'instances, la valeur moyenne est calculée pour toutes les instances du pool.

NetworksBytesIn1, 2 Octets de réception réseau octets

Débit de réception réseau. Exprimé en octets reçus.

NetworksBytesOut1, 2 Octets de transmission réseau octets Débit de transmission réseau. Exprimé en octets transmis.

1Cette mesure est un compteur cumulatif qui indique un comportement à croissance monotone pour chaque session du logiciel d'agent Oracle Cloud, avec une réinitialisation lorsque le système d'exploitation est redémarré.

2Le service Networking fournit des mesures supplémentaires (dans l'espace de noms de mesure oci_vcn) pour chaque carte d'interface réseau virtuelle de l'instance. Pour plus d'informations, reportez-vous à Mesures de Networking.

3Le service Block Volume fournit des mesures supplémentaires (dans l'espace de noms de mesure oci_blockstore) pour chaque volume attaché à l'instance. Pour plus d'informations, reportez-vous à Mesures de Block Volume.

Mesures disponibles : gpu_infrastructure_health

Les mesures d'instance de calcul vous aident à mesurer le niveau d'activité et le débit des instances de calcul. Les mesures répertoriées dans le tableau suivant sont disponibles pour toute instance de calcul pour laquelle la surveillance est activée. Pour obtenir ces mesures, activez la surveillance sur l'instance.

Les mesures de cet espace de noms sont agrégées pour toutes les ressources associées sur l'instance. Par exemple, DiskBytesRead est agrégé pour tous les volumes de stockage attachés de l'instance et NetworkBytesIn est agrégé pour toutes les cartes d'interface réseau virtuelles attachées de l'instance.

Pour les mesures émises par l'espace de noms de mesure gpu_infrastructure_health, les points de données sont échantillonnés toutes les dix secondes. Un lot de six points de données est émis toutes les minutes. Par conséquent, pour chaque minute, le décompte agrégé est toujours six, la somme agrégée est la somme des six points de données et la moyenne agrégée correspond à la moyenne des six points de données.

Vous pouvez également utiliser le service Monitoring pour créer des requêtes personnalisées.

Chaque mesure inclut les dimensions  suivantes :

composant
GPU ou rdma_nic
horodatage
Heure UTC d'émission de la charge utile/du signal d'activité
version
Numéro de version de la charge utile pour la compatibilité
Mesure Nom d'affichage de mesure Unité Description Dimensions
GpuUtilization Utilisation de GPU pourcentage

Niveau d'activité du GPU. Exprimé en pourcentage du temps total.

Pour les pools d'instances, la valeur moyenne est calculée pour toutes les instances du pool.

availabilityDomain

faultDomain

gpuId

imageId

instancePoolId

region

resourceDisplayName

resourceId

shape

GpuMemoryUtilization Utilisation de la mémoire GPU pourcentage Pourcentage de la ressource de mémoire GPU utilisée.
GpuPowerDraw Alimentation de GPU entier Quantité d'énergie GPU utilisée.
GpuTemperature Température de GPU entier Température du GPU signalée.
GpuEccSingleBitErrors Erreurs de GPU à un seul bit entier Nombre d'erreurs ECC monobit GPU signalées.
GpuEccDoubleBitErrors Erreurs GPU double-bit entier Nombre d'erreurs ECC de double bit de GPU signalées.

1Cette mesure est un compteur cumulatif qui indique un comportement à croissance monotone pour chaque session du logiciel d'agent Oracle Cloud, avec une réinitialisation lorsque le système d'exploitation est redémarré.

2Le service Networking fournit des mesures supplémentaires (dans l'espace de noms de mesure oci_vcn) pour chaque carte d'interface réseau virtuelle de l'instance. Pour plus d'informations, reportez-vous à Mesures de Networking.

3Le service Block Volume fournit des mesures supplémentaires (dans l'espace de noms de mesure oci_blockstore) pour chaque volume attaché à l'instance. Pour plus d'informations, reportez-vous à Mesures de Block Volume.

Mesures disponibles : rdma_infrastructure_health

Les mesures d'instance de calcul vous aident à mesurer le niveau d'activité et le débit des instances de calcul. Les mesures répertoriées dans le tableau suivant sont disponibles pour toute instance de calcul pour laquelle la surveillance est activée. Pour obtenir ces mesures, activez la surveillance sur l'instance.

Les mesures de cet espace de noms sont agrégées pour toutes les ressources associées sur l'instance. Par exemple, DiskBytesRead est agrégé pour tous les volumes de stockage attachés de l'instance et NetworkBytesIn est agrégé pour toutes les cartes d'interface réseau virtuelles attachées de l'instance.

Pour les mesures émises par l'espace de noms de mesure rdma_infrastructure_health, les points de données sont échantillonnés toutes les dix secondes. Un lot de six points de données est émis toutes les minutes. Par conséquent, pour chaque minute, le décompte agrégé est toujours six, la somme agrégée est la somme des six points de données et la moyenne agrégée correspond à la moyenne des six points de données.

Vous pouvez également utiliser le service Monitoring pour créer des requêtes personnalisées.

Chaque mesure inclut les dimensions  suivantes :

composant
GPU ou rdma_nic
horodatage
Heure UTC d'émission de la charge utile/du signal d'activité
version
Numéro de version de la charge utile pour la compatibilité
Mesure Nom d'affichage de mesure Unité Description Dimensions
RdmaTxBytes octets agrégés de transmission réseau RDMA octets octets transmis sur l'interface RDMA.

availabilityDomain

faultDomain

imageId

instancePoolId

rdmaId

region

resourceDisplayName

resourceId

shape

RdmaRxBytes octets agrégés de réception réseau RDMA octets octets reçus sur l'interface RDMA.
RdmaTxPackets Paquets de transmission réseau agrégés RDMA entier Nombre de paquets d'interface RDMA transmis.
RdmaRxPackets Paquets de réception réseau agrégés RDMA entier Nombre de paquets d'interface RDMA reçus.

1Cette mesure est un compteur cumulatif qui indique un comportement à croissance monotone pour chaque session du logiciel d'agent Oracle Cloud, avec une réinitialisation lorsque le système d'exploitation est redémarré.

2Le service Networking fournit des mesures supplémentaires (dans l'espace de noms de mesure oci_vcn) pour chaque carte d'interface réseau virtuelle de l'instance. Pour plus d'informations, reportez-vous à Mesures de Networking.

3Le service Block Volume fournit des mesures supplémentaires (dans l'espace de noms de mesure oci_blockstore) pour chaque volume attaché à l'instance. Pour plus d'informations, reportez-vous à Mesures de Block Volume.

Utilisation de la console

Procédure de visualisation des graphiques de mesures pour une instance de calcul unique
  1. Ouvrez le menu de navigation et cliquez sur Compute. Sous Compute, cliquez sur Instances.
  2. Cliquez sur l'instance qui vous intéresse.
  3. Sous Ressources, cliquez sur Mesures.
  4. Dans la liste Espace de noms de mesure, sélectionnez oci_computeagent.

    La page Mesures affiche un ensemble de graphiques par défaut pour l'instance en cours.

    Aucun graphique de mesures n'apparaît pour l'instance ?

    Si aucun graphique de mesures n'apparaît, l'instance n'émet peut-être pas de mesures. Reportez-vous aux causes possibles et aux résolutions suivantes.

    Cause possible Vérification Résolution
    Le module d'extension de surveillance des instances de calcul est désactivé sur l'instance ou des modules d'extension sont arrêtés. Vérifiez les propriétés de l'instance. Activez le module d'extension de surveillance des instances de calcul et démarrez tous les modules d'extension.
    L'instance ne peut pas accéder au service Monitoring car son VCN n'utilise pas Internet. Vérifiez l'adresse IP de l'instance. Si elle n'est pas publique, une passerelle de service est nécessaire. Configurez une passerelle de service.
    L'instance n'utilise pas une image prise en charge. Vérifiez les images prises en charge. Créez une instance avec une image prise en charge.
    Images plus anciennes et images personnalisées : aucun logiciel d'agent Oracle Cloud n'existe sur l'instance. Connectez-vous à l'instance et recherchez le logiciel. Installez le logiciel d'agent Oracle Cloud.
    Le logiciel d'agent Oracle Cloud pose un autre problème. (non applicable) Suivez les étapes de dépannage de l'agent Oracle Cloud.

    Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, reportez-vous à Présentation de Monitoring. Pour plus d'informations sur les notifications relatives aux alarmes, reportez-vous à Présentation de Notifications.

Procédure de visualisation des graphiques de mesures par défaut pour toutes les instances de calcul d'un compartiment
  1. Ouvrez le menu de navigation et cliquez sur Observability and Management. Sous Surveillance, cliquez sur Mesures de service.
  2. Sélectionnez un compartiment.
  3. Pour Espace de noms de mesure, sélectionnez oci_computeagent.

    La page Mesures de service est mise à jour de façon dynamique afin d'afficher les graphiques de chaque mesure émise par l'espace de noms de mesure sélectionné.

Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, reportez-vous à Présentation de Monitoring. Pour plus d'informations sur les notifications relatives aux alarmes, reportez-vous à Présentation de Notifications.

Procédure de visualisation des graphiques de mesures par défaut des instances d'un pool
  1. Ouvrez le menu de navigation et cliquez sur Compute. Sous Compute, cliquez sur Pools d'instances.
  2. Cliquez sur le pool d'instances qui vous intéresse.
  3. Sous Ressources, cliquez sur Mesures.
  4. Dans la liste Espace de noms de mesure, sélectionnez oci_computeagent.

    La page Mesures affiche un ensemble de graphiques par défaut pour le pool d'instances en cours.

Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, reportez-vous à Présentation de Monitoring. Pour plus d'informations sur les notifications relatives aux alarmes, reportez-vous à Présentation de Notifications.