Mesures d'état d'instance Compute
Vous pouvez surveiller l'état, la capacité et les performances de vos instances de machine virtuelle de calcul à l'aide de mesures, d'alarmes et de notifications.
Cette rubrique décrit les mesures émises par l'espace de noms de mesure oci_compute_instance_health
.
Ressources : instances de machine virtuelle de calcul.
Présentation des mesures : oci_compute_instance_health
La mesure d'état d'instance de calcul suivante vous aide à surveiller le statut, l'état et l'accessibilité des instances de calcul.
Statut d'accessibilité de l'instance : la mesure instance_accessibility_status
vous permet de surveiller si une instance de machine virtuelle ne répond pas. Compute envoie une demande ARP (Address Resolution Protocol) à la carte d'interface réseau virtuelle de l'instance. Si la commande ping ARP échoue, la mesure indique que l'instance ne répond pas.
La mesure
instance_accessibility_status
ne détermine ni ne signale le motif spécifique de l'absence de réponse de l'instance. Le test ARP ne fournit aucun aperçu des problèmes possibles avec le système d'exploitation de l'instance.Statut du système de fichiers d'instance : la mesure instance_file_system_status
permet de surveiller si une instance de machine virtuelle présente un problème d'anomalie de système de fichiers. Compute analyse les journaux du noyau de machine virtuelle pour déterminer le statut du volume. Si le volume présente un statut d'anomalie, la mesure indique le type et le volume du problème.
La mesure
instance_file_system_status
ne détermine ni ne signale la raison spécifique du problème de système de fichiers de l'instance, ni les problèmes avec le système d'exploitation ou les volumes de l'instance.// The query does not specify the volume type, it can be used for general monitoring purpose of read-only volume issues. Users can get volumeType info by inspecting the "volumeType" dimension of the metrics.
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY"}.max()
// The queries below specify the volume type, they can be used for specific monitoring purposes
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = BOOT_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = DATA_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = UNKNOWN}.max()
- Consultez les mesures d'état de l'infrastructure pour vérifier si un problème d'infrastructure est en cours. En cas de problème d'infrastructure en cours, attendez qu'Oracle Cloud Infrastructure le résolve, puis vérifiez de nouveau la mesure
instance_accessibility_status
. - Si aucun problème d'infrastructure n'est en cours, l'instance présente probablement un problème logiciel ou une erreur de configuration réseau que vous devez résoudre vous-même. Vérifiez que le système d'exploitation et le réseau sont correctement configurés. Reportez-vous aux suggestions de dépannage de Compute et à celles de Networking.
- Si les étapes de dépannage de Compute et de Networking échouent, vous pouvez utiliser un redémarrage de diagnostic pour reconstruire une instance inaccessible.
Stratégie IAM requise
Pour surveiller des ressources, vous devez posséder le type d'accès requis dans une stratégie écrite par un administrateur, que vous utilisiez la console ou l'API REST avec un kit SDK, une interface d'interface de ligne de demande ou tout autre outil. La stratégie doit vous donner accès à la fois aux services de surveillance et aux ressources surveillées. Si vous essayez d'effectuer une action et qu'un message vous indique que vous n'y êtes pas autorisé, contactez l'administrateur pour savoir quel type d'accès vous a été accordé et dans quel compartiment vous devez travailler. Pour plus d'informations sur les autorisations utilisateurs liées à la surveillance, reportez-vous à Stratégies IAM.
Mesures disponibles : oci_compute_instance_health
Les mesures répertoriées dans le tableau suivant sont automatiquement disponibles pour vos instances. Vous n'avez pas besoin d'activer la surveillance sur l'instance pour obtenir ces mesures.
Vous pouvez également utiliser le service Monitoring pour créer des requêtes personnalisées.
Les mesures incluent les dimensions suivantes :
- resourceDisplayName
- Nom convivial de l'instance.
- resourceId
- OCID de l'instance.
- volumeType
- Type de volume présentant un problème. Les valeurs sont comprises entre
BOOT_VOLUME, DATA_VOLUME,
etUNKNOWN
. Lorsque la valeur estUNKNOWN
, le type de volume présentant un problème ne peut pas être déterminé. - issueType
- Type de problème de système de fichiers. La valeur est
READ_ONLY
lorsque le volume d'instance est en modeREAD_ONLY
.
Mesure | Nom d'affichage de mesure | Unité | Description | Dimensions |
---|---|---|---|---|
instance_accessibility_status
|
Statut d'accessibilité de l'instance | Nombre | Statut d'accessibilité d'une instance de machine virtuelle. La valeur 1 indique que l'instance ne répond pas en raison d'un problème avec l'infrastructure ou avec l'instance elle-même. La valeur 0 indique qu'aucun problème d'accessibilité n'a été détecté. Si l'instance est arrêtée, la mesure ne possède aucune valeur. |
|
instance_file_system_status
|
Statut de système de fichiers d'instance | Nombre |
Statut du système de fichiers d'une instance de machine virtuelle. La valeur 1 indique que l'instance présente un problème de système de fichiers en raison de l'infrastructure ou de l'instance elle-même. La valeur 0 indique que le problème de système de fichiers n'a pas été détecté. Si l'instance est arrêtée, la mesure ne possède aucune valeur. |
|
Utilisation de la console
- Ouvrez le menu de navigation et sélectionnez Compute. Sous Compute, sélectionnez Instances.
- Cliquez sur l'instance qui vous intéresse.
- Sous Ressources, cliquez sur Mesures.
-
Dans la liste Espace de noms de mesure, sélectionnez oci_compute_instance_health.
La page Mesures affiche un ensemble de graphiques par défaut pour l'instance en cours.
Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, reportez-vous à Présentation de Monitoring. Pour plus d'informations sur les notifications relatives aux alarmes, reportez-vous à Présentation de Notifications.
- Ouvrez le menu de navigation et sélectionnez Observation et gestion. Sous Monitoring, sélectionnez Mesures de service.
- Sélectionnez un compartiment.
-
Pour Espace de noms de mesure, sélectionnez oci_compute_instance_health.
La page Mesures de service est mise à jour de façon dynamique afin d'afficher les graphiques de chaque mesure émise par l'espace de noms de mesure sélectionné.
Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, reportez-vous à Présentation de Monitoring. Pour plus d'informations sur les notifications relatives aux alarmes, reportez-vous à Présentation de Notifications.
Utilisation de l'API
Pour plus d'informations sur l'utilisation de l'API et la signature des demandes, reportez-vous à la documentation relative à l'API REST et à Informations d'identification de sécurité. Pour plus d'informations sur les kits SDK, reportez-vous à Kits SDK et interface de ligne de commande.
- API Monitoring pour les mesures et les alarmes
- API Notifications pour les notifications (utilisée avec des alarmes)