Mesures de l'état des instances de calcul

Vous pouvez surveiller l'état, la capacité et la performance des instances de machine virtuelle du service de calcul en utilisant des mesures, des alarmes et des avis.

Cette rubrique décrit les mesures émises par l'espace de noms de mesure oci_compute_instance_health.

Ressources : Instances de machine virtuelle du service Calcul.

Aperçu des mesures : oci_compute_instance_health

La mesure d'état d'instance de calcul suivante vous aide à surveiller le statut, l'état et l'accessibilité des instances de calcul.

Statut d'accessibilité de l'instance : La mesure instance_accessibility_status vous permet de surveiller si une instance de machine virtuelle ne répond pas. Le service Calcul envoie une demande de protocole de résolution d'adresse (ARP) à la carte d'interface réseau virtuelle (VNIC) de l'instance. Si la commande ping ARP échoue, la mesure indique que l'instance ne répond pas.

Note

La mesure instance_accessibility_status ne détermine pas ou ne signale pas le motif spécifique de l'absence de réponse de l'instance. Le test ARP ne fournit aucun aperçu des problèmes possibles avec le système d'exploitation de l'instance.

Statut du système de fichiers de l'instance : La mesure instance_file_system_status vous permet de surveiller si une instance de machine virtuelle présente un problème d'anomalie dans le système de fichiers. Le service de calcul analyse les journaux du noyau de machine virtuelle pour déterminer le statut du volume. Si le volume a un statut d'anomalie, la mesure indique le type et le volume du problème.

Note

La mesure instance_file_system_status ne détermine pas ou ne signale pas le motif spécifique du problème du système de fichiers de l'instance ou des problèmes liés au système d'exploitation ou aux volumes de l'instance.
Utilisation de MQL pour voir instance_file_system_status
// The query does not specify the volume type, it can be used for general monitoring purpose of read-only volume issues. Users can get volumeType info by inspecting the "volumeType" dimension of the metrics. 
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY"}.max()
// The queries below specify the volume type, they can be used for specific monitoring purposes
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = BOOT_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = DATA_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = UNKNOWN}.max()
Dépannage d'une instance de machine virtuelle qui ne répond pas
  1. Vérifiez les mesures d'état de l'infrastructure pour déterminer s'il y a un problème d'infrastructure. En cas de problème d'infrastructure, attendez qu'il soit résolu par Oracle Cloud Infrastructure, puis vérifiez à nouveau la mesure instance_accessibility_status.
  2. S'il n'y a pas de problème d'infrastructure, il s'agit probablement d'un problème logiciel ou d'une configuration de réseau incorrecte que vous devez corriger vous-même. Vérifiez que le système d'exploitation et le réseau sont correctement configurés. Voir les suggestions de dépannage pour le service Calcul et le service Réseau.
  3. Si les étapes de dépannage du service Calcul et du service Réseau échouent, vous pouvez utiliser un redémarrage de diagnostic pour recréer une instance inaccessible.

Politique GIA requise

Pour surveiller des ressources, vous devez disposer du type d'accès requis qui vous est accordé dans une politique écrite par un administrateur, que vous utilisiez la console ou l'API REST avec une trousse SDK, l'interface de ligne de commande ou un autre outil. La politique doit vous donner accès à la fois aux services de surveillance et aux ressources surveillées. Si vous essayez d'effectuer une action et obtenez un message indiquant que vous ne disposez pas de l'autorisation requise, communiquez avec l'administrateur pour connaître le type d'accès qui vous a été octroyé et le compartiment que vous devez utiliser. Pour plus d'informations sur les autorisations d'utilisateur pour la surveillance, voir Politiques IAM.

Mesures disponibles : oci_compute_instance_health

Les mesures listées dans le tableau suivant sont automatiquement disponibles pour vos instances. Il n'est pas nécessaire d'activer la surveillance de l'instance pour obtenir ces mesures.

Vous pouvez également utiliser le service Surveillance pour créer des interrogations personnalisées.

Les mesures comprennent les dimensions suivantes :

resourceDisplayName
Nom convivial de l'instance.
resourceId
OCID de l'instance.
volumeType
Type de volume qui présente un problème. Les valeurs sont comprises entre BOOT_VOLUME, DATA_VOLUME, et UNKNOWN. Lorsque la valeur est UNKNOWN, le type de volume ayant un problème ne peut pas être déterminé.
issueType
Type de problème de système de fichiers. La valeur est READ_ONLY lorsque le volume de l'instance est en mode READ_ONLY.
Mesure Nom d'affichage de la mesure Unité Description Dimensions
instance_accessibility_status Statut d'accessibilité de l'instance Nombre Statut d'accessibilité d'une instance de machine virtuelle. La valeur 1 indique que l'instance ne répond pas en raison d'un problème lié à l'infrastructure ou à l'instance elle-même. La valeur 0 indique qu'un problème d'accessibilité n'a pas été détecté. Si l'instance est arrêtée, la mesure n'a pas de valeur.

resourceDisplayName

resourceId

instance_file_system_status Statut du système de fichiers de l'instance Nombre

Statut du système de fichiers d'une instance de machine virtuelle. La valeur 1 indique que l'instance présente un problème de système de fichiers en raison de l'infrastructure ou de l'instance elle-même. La valeur 0 indique que le problème du système de fichiers n'a pas été détecté.

Si l'instance est arrêtée, la mesure n'a pas de valeur.

resourceDisplayName

resourceId

volumeType

issueType

Utilisation de la console

Pour voir les mesures d'état du service de calcul d'une instance unique
  1. Ouvrez le menu de navigation et sélectionnez Calcul. Sous Calcul, sélectionnez Instances.
  2. Cliquez sur l'instance qui vous intéresse.
  3. Sous Ressources, cliquez sur Mesures.
  4. Dans la liste Espace de noms de mesure, sélectionnez oci_compute_instance_health.

    La page Mesures affiche un jeu de graphiques par défaut pour l'instance courante.

Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, voir Aperçu de la surveillance. Pour plus d'informations sur les avis relatifs aux alarmes, voir Aperçu des avis.

Pour voir les mesures d'état du service de calcul pour toutes les instances d'un compartiment
  1. Ouvrez le menu de navigation et sélectionnez Observabilité et gestion. Sous Surveillance, sélectionnez Mesures de service.
  2. Sélectionnez un compartiment.
  3. Pour Espace de noms de mesure, sélectionnez oci_compute_instance_health.

    La page Mesures de service est mise à jour de manière dynamique pour afficher les graphiques de chaque mesure émise par l'espace de noms de mesure sélectionné.

Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, voir Aperçu de la surveillance. Pour plus d'informations sur les avis relatifs aux alarmes, voir Aperçu des avis.