Mesures d'état d'instance Compute

Vous pouvez surveiller l'état, la capacité et les performances de vos instances de machine virtuelle de calcul à l'aide de mesures, d'alarmes et de notifications.

Cette rubrique décrit les mesures émises par l'espace de noms de mesure oci_compute_instance_health.

Ressources : instances de machine virtuelle de calcul.

Présentation des mesures : oci_compute_instance_health

La mesure d'état d'instance de calcul suivante vous aide à surveiller le statut, l'état et l'accessibilité des instances de calcul.

Statut d'accessibilité de l'instance : la mesure instance_accessibility_status vous permet de surveiller si une instance de machine virtuelle ne répond pas. Compute envoie une demande ARP (Address Resolution Protocol) à la carte d'interface réseau virtuelle de l'instance. Si la commande ping ARP échoue, la mesure indique que l'instance ne répond pas.

Remarque

La mesure instance_accessibility_status ne détermine ni ne signale le motif spécifique de l'absence de réponse de l'instance. Le test ARP ne fournit aucun aperçu des problèmes possibles avec le système d'exploitation de l'instance.

Statut du système de fichiers d'instance : la mesure instance_file_system_status permet de surveiller si une instance de machine virtuelle présente un problème d'anomalie de système de fichiers. Compute analyse les journaux du noyau de machine virtuelle pour déterminer le statut du volume. Si le volume présente un statut d'anomalie, la mesure indique le type et le volume du problème.

Remarque

La mesure instance_file_system_status ne détermine ni ne signale la raison spécifique du problème de système de fichiers de l'instance, ni les problèmes avec le système d'exploitation ou les volumes de l'instance.
Utilisation de MQL pour visualiser instance_file_system_status
// The query does not specify the volume type, it can be used for general monitoring purpose of read-only volume issues. Users can get volumeType info by inspecting the "volumeType" dimension of the metrics. 
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY"}.max()
// The queries below specify the volume type, they can be used for specific monitoring purposes
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = BOOT_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = DATA_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = UNKNOWN}.max()
Dépannage d'une instance de machine virtuelle qui ne répond pas
  1. Consultez les mesures d'état de l'infrastructure pour vérifier si un problème d'infrastructure est en cours. En cas de problème d'infrastructure en cours, attendez qu'Oracle Cloud Infrastructure le résolve, puis vérifiez de nouveau la mesure instance_accessibility_status.
  2. Si aucun problème d'infrastructure n'est en cours, l'instance présente probablement un problème logiciel ou une erreur de configuration réseau que vous devez résoudre vous-même. Vérifiez que le système d'exploitation et le réseau sont correctement configurés. Reportez-vous aux suggestions de dépannage de Compute et à celles de Networking.
  3. Si les étapes de dépannage de Compute et de Networking échouent, vous pouvez utiliser un redémarrage de diagnostic pour reconstruire une instance inaccessible.

Stratégie IAM requise

Pour surveiller des ressources, vous devez posséder le type d'accès requis dans une stratégie écrite par un administrateur, que vous utilisiez la console ou l'API REST avec un kit SDK, une interface d'interface de ligne de demande ou tout autre outil. La stratégie doit vous donner accès à la fois aux services de surveillance et aux ressources surveillées. Si vous essayez d'effectuer une action et qu'un message vous indique que vous n'y êtes pas autorisé, contactez l'administrateur pour savoir quel type d'accès vous a été accordé et dans quel compartiment vous devez travailler. Pour plus d'informations sur les autorisations utilisateurs liées à la surveillance, reportez-vous à Stratégies IAM.

Mesures disponibles : oci_compute_instance_health

Les mesures répertoriées dans le tableau suivant sont automatiquement disponibles pour vos instances. Vous n'avez pas besoin d'activer la surveillance sur l'instance pour obtenir ces mesures.

Vous pouvez également utiliser le service Monitoring pour créer des requêtes personnalisées.

Les mesures incluent les dimensions suivantes :

resourceDisplayName
Nom convivial de l'instance.
resourceId
OCID  de l'instance.
volumeType
Type de volume présentant un problème. Les valeurs sont comprises entre BOOT_VOLUME, DATA_VOLUME, et UNKNOWN. Lorsque la valeur est UNKNOWN, le type de volume présentant un problème ne peut pas être déterminé.
issueType
Type de problème de système de fichiers. La valeur est READ_ONLY lorsque le volume d'instance est en mode READ_ONLY.
Mesure Nom d'affichage de mesure Unité Description Dimensions
instance_accessibility_status Statut d'accessibilité de l'instance Nombre Statut d'accessibilité d'une instance de machine virtuelle. La valeur 1 indique que l'instance ne répond pas en raison d'un problème avec l'infrastructure ou avec l'instance elle-même. La valeur 0 indique qu'aucun problème d'accessibilité n'a été détecté. Si l'instance est arrêtée, la mesure ne possède aucune valeur.

resourceDisplayName

resourceId

instance_file_system_status Statut de système de fichiers d'instance Nombre

Statut du système de fichiers d'une instance de machine virtuelle. La valeur 1 indique que l'instance présente un problème de système de fichiers en raison de l'infrastructure ou de l'instance elle-même. La valeur 0 indique que le problème de système de fichiers n'a pas été détecté.

Si l'instance est arrêtée, la mesure ne possède aucune valeur.

resourceDisplayName

resourceId

volumeType

issueType

Utilisation de la console

Procédure de visualisation des mesures d'état de calcul d'une instance unique
  1. Ouvrez le menu de navigation et sélectionnez Compute. Sous Compute, sélectionnez Instances.
  2. Cliquez sur l'instance qui vous intéresse.
  3. Sous Ressources, cliquez sur Mesures.
  4. Dans la liste Espace de noms de mesure, sélectionnez oci_compute_instance_health.

    La page Mesures affiche un ensemble de graphiques par défaut pour l'instance en cours.

Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, reportez-vous à Présentation de Monitoring. Pour plus d'informations sur les notifications relatives aux alarmes, reportez-vous à Présentation de Notifications.

Procédure de visualisation des mesures d'état de calcul de toutes les instances d'un compartiment
  1. Ouvrez le menu de navigation et sélectionnez Observation et gestion. Sous Monitoring, sélectionnez Mesures de service.
  2. Sélectionnez un compartiment.
  3. Pour Espace de noms de mesure, sélectionnez oci_compute_instance_health.

    La page Mesures de service est mise à jour de façon dynamique afin d'afficher les graphiques de chaque mesure émise par l'espace de noms de mesure sélectionné.

Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, reportez-vous à Présentation de Monitoring. Pour plus d'informations sur les notifications relatives aux alarmes, reportez-vous à Présentation de Notifications.