Mesures de l'état des instances de calcul
Vous pouvez surveiller l'état, la capacité et la performance des instances de machine virtuelle du service de calcul en utilisant des mesures, des alarmes et des avis.
Cette rubrique décrit les mesures émises par l'espace de noms de mesure oci_compute_instance_health
.
Ressources : Instances de machine virtuelle du service Calcul.
Aperçu des mesures : oci_compute_instance_health
La mesure d'état d'instance de calcul suivante vous aide à surveiller le statut, l'état et l'accessibilité des instances de calcul.
Statut d'accessibilité de l'instance : La mesure instance_accessibility_status
vous permet de surveiller si une instance de machine virtuelle ne répond pas. Le service Calcul envoie une demande de protocole de résolution d'adresse (ARP) à la carte d'interface réseau virtuelle (VNIC) de l'instance. Si la commande ping ARP échoue, la mesure indique que l'instance ne répond pas.
La mesure
instance_accessibility_status
ne détermine pas ou ne signale pas le motif spécifique de l'absence de réponse de l'instance. Le test ARP ne fournit aucun aperçu des problèmes possibles avec le système d'exploitation de l'instance.Statut du système de fichiers de l'instance : La mesure instance_file_system_status
vous permet de surveiller si une instance de machine virtuelle présente un problème d'anomalie dans le système de fichiers. Le service de calcul analyse les journaux du noyau de machine virtuelle pour déterminer le statut du volume. Si le volume a un statut d'anomalie, la mesure indique le type et le volume du problème.
La mesure
instance_file_system_status
ne détermine pas ou ne signale pas le motif spécifique du problème du système de fichiers de l'instance ou des problèmes liés au système d'exploitation ou aux volumes de l'instance.// The query does not specify the volume type, it can be used for general monitoring purpose of read-only volume issues. Users can get volumeType info by inspecting the "volumeType" dimension of the metrics.
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY"}.max()
// The queries below specify the volume type, they can be used for specific monitoring purposes
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = BOOT_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = DATA_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = UNKNOWN}.max()
- Vérifiez les mesures d'état de l'infrastructure pour déterminer s'il y a un problème d'infrastructure. En cas de problème d'infrastructure, attendez qu'il soit résolu par Oracle Cloud Infrastructure, puis vérifiez à nouveau la mesure
instance_accessibility_status
. - S'il n'y a pas de problème d'infrastructure, il s'agit probablement d'un problème logiciel ou d'une configuration de réseau incorrecte que vous devez corriger vous-même. Vérifiez que le système d'exploitation et le réseau sont correctement configurés. Voir les suggestions de dépannage pour le service Calcul et le service Réseau.
- Si les étapes de dépannage du service Calcul et du service Réseau échouent, vous pouvez utiliser un redémarrage de diagnostic pour recréer une instance inaccessible.
Politique GIA requise
Pour surveiller des ressources, vous devez disposer du type d'accès requis qui vous est accordé dans une politique écrite par un administrateur, que vous utilisiez la console ou l'API REST avec une trousse SDK, l'interface de ligne de commande ou un autre outil. La politique doit vous donner accès à la fois aux services de surveillance et aux ressources surveillées. Si vous essayez d'effectuer une action et obtenez un message indiquant que vous ne disposez pas de l'autorisation requise, communiquez avec l'administrateur pour connaître le type d'accès qui vous a été octroyé et le compartiment que vous devez utiliser. Pour plus d'informations sur les autorisations d'utilisateur pour la surveillance, voir Politiques IAM.
Mesures disponibles : oci_compute_instance_health
Les mesures listées dans le tableau suivant sont automatiquement disponibles pour vos instances. Il n'est pas nécessaire d'activer la surveillance de l'instance pour obtenir ces mesures.
Vous pouvez également utiliser le service Surveillance pour créer des interrogations personnalisées.
Les mesures comprennent les dimensions suivantes :
- resourceDisplayName
- Nom convivial de l'instance.
- resourceId
- OCID de l'instance.
- volumeType
- Type de volume qui présente un problème. Les valeurs sont comprises entre
BOOT_VOLUME, DATA_VOLUME,
etUNKNOWN
. Lorsque la valeur estUNKNOWN
, le type de volume ayant un problème ne peut pas être déterminé. - issueType
- Type de problème de système de fichiers. La valeur est
READ_ONLY
lorsque le volume de l'instance est en modeREAD_ONLY
.
Mesure | Nom d'affichage de la mesure | Unité | Description | Dimensions |
---|---|---|---|---|
instance_accessibility_status
|
Statut d'accessibilité de l'instance | Nombre | Statut d'accessibilité d'une instance de machine virtuelle. La valeur 1 indique que l'instance ne répond pas en raison d'un problème lié à l'infrastructure ou à l'instance elle-même. La valeur 0 indique qu'un problème d'accessibilité n'a pas été détecté. Si l'instance est arrêtée, la mesure n'a pas de valeur. |
|
instance_file_system_status
|
Statut du système de fichiers de l'instance | Nombre |
Statut du système de fichiers d'une instance de machine virtuelle. La valeur 1 indique que l'instance présente un problème de système de fichiers en raison de l'infrastructure ou de l'instance elle-même. La valeur 0 indique que le problème du système de fichiers n'a pas été détecté. Si l'instance est arrêtée, la mesure n'a pas de valeur. |
|
Utilisation de la console
- Ouvrez le menu de navigation et sélectionnez Calcul. Sous Calcul, sélectionnez Instances.
- Cliquez sur l'instance qui vous intéresse.
- Sous Ressources, cliquez sur Mesures.
-
Dans la liste Espace de noms de mesure, sélectionnez oci_compute_instance_health.
La page Mesures affiche un jeu de graphiques par défaut pour l'instance courante.
Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, voir Aperçu de la surveillance. Pour plus d'informations sur les avis relatifs aux alarmes, voir Aperçu des avis.
- Ouvrez le menu de navigation et sélectionnez Observabilité et gestion. Sous Surveillance, sélectionnez Mesures de service.
- Sélectionnez un compartiment.
-
Pour Espace de noms de mesure, sélectionnez oci_compute_instance_health.
La page Mesures de service est mise à jour de manière dynamique pour afficher les graphiques de chaque mesure émise par l'espace de noms de mesure sélectionné.
Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, voir Aperçu de la surveillance. Pour plus d'informations sur les avis relatifs aux alarmes, voir Aperçu des avis.
Utilisation de l'API
Pour plus d'informations sur l'utilisation de l'API et sur les demandes de signature, voir la documentation de l'API REST et Données d'identification de sécurité. Pour plus d'informations sur les trousses SDK, voir Trousses SDK et interface de ligne de commande.
- API de surveillance pour les mesures et les alarmes
- API d'avis pour les avis (utilisée avec les alarmes)