Mesures de Kubernetes Engine (OKE)
Découvrez les mesures émises par Kubernetes Engine (OKE).
Vous pouvez surveiller l'état, la capacité et les performances des clusters Kubernetes gérés par Kubernetes Engine à l'aide de mesures , d'alarmes et de notifications.
Cette rubrique décrit les mesures émises par Kubernetes Engine dans l'espace de noms de mesure oci_oke
.
Ressources : clusters, noeuds de processus actifs
Présentation des mesures du service Kubernetes Engine (OKE)
Les mesures de Kubernetes Engine vous aident à surveiller les clusters Kubernetes, ainsi que les pools de noeuds et les noeuds de processus actifs individuels. Vous pouvez utiliser les données de mesure pour diagnostiquer et résoudre les problèmes liés aux pools de noeuds et aux clusters.
Alors que la fréquence varie en fonction de la mesure, la fréquence des mesures de service par défaut est généralement de 60 secondes (c'est-à-dire, au moins un point de données publié par minute).
Pour visualiser un ensemble par défaut de graphes de mesures dans la console, accédez au cluster dont vous avez besoin, puis sélectionnez Mesures. Vous pouvez également utiliser le service Monitoring pour créer des requêtes personnalisées. Reportez-vous à Construction de requêtes de mesure.
Prérequis
Stratégies IAM : pour surveiller des ressources, vous devez posséder le type d'accès requis dans une stratégie écrite par un administrateur, que vous utilisiez la console ou l'API REST avec un kit SDK, une CLI ou tout autre outil. La stratégie doit vous donner accès à la fois aux services de surveillance et aux ressources surveillées. Si vous essayez d'effectuer une action et qu'un message vous indique que vous n'y êtes pas autorisé, contactez l'administrateur pour savoir quel type d'accès vous a été accordé et dans quel compartiment vous devez travailler. Pour plus d'informations sur les autorisations utilisateurs liées à la surveillance, reportez-vous à Stratégies IAM.
Par exemple, pour observer la condition des noeuds dans un cluster Kubernetes, vous devez disposer d'un accès à l'aide d'une instruction de stratégie semblable à la suivante :
Allow group <group-name> to read metrics in <location>
Mesures disponibles : oci_oke
Les mesures présentées dans les tableaux suivants sont automatiquement disponibles pour tous les clusters Kubernetes que vous créez. Vous n'avez pas besoin d'activer la surveillance sur la ressource pour obtenir ces mesures.
Les mesures de Kubernetes Engine incluent les dimensions suivantes :
- resourceId
- OCID de la ressource à laquelle la mesure s'applique.
- resourceDisplayName
- Nom de la ressource à laquelle la mesure s'applique.
- responseCode
- Code de réponse envoyé par le serveur d'API Kubernetes.
- responseGroup
- Groupe de codes de réponse, basé sur le premier chiffre du code de réponse (par exemple, 2xx, 3xx, 4xx, 5xx).
- clusterId
- OCID du cluster auquel la mesure s'applique.
- nodepoolId
- OCID du pool de noeuds auquel la mesure s'applique.
- nodeState
- Etat de l'instance de calcul hébergeant le noeud de processus actif. Par exemple, ACTIVE, CREATING, DELETING, DELETED, FAILED, UPDATING, INACTIVE.
- nodeCondition
- Condition du noeud de processus actif telle qu'indiquée par le serveur d'API Kubernetes. Par exemple, Ready, MemoryPressure, PIDPressure, DiskPressure, NetworkUnavailable.
- availabilityDomain
- Domaine de disponibilité dans lequel réside l'instance de calcul.
- faultDomain
- Domaine de pannes dans lequel réside l'instance de calcul.
Mesure | Nom d'affichage de la mesure | Unité | Description | Dimensions |
---|---|---|---|---|
APIServerRequestCount
|
Demandes de serveur d'API | nombre | Nombre de demandes reçues par le serveur d'API Kubernetes. |
|
APIServerResponseCount
|
Nombre de réponses du serveur d'API | nombre | Nombre de réponses différentes autres que des réponses 200 (c'est-à-dire, les réponses d'erreur) envoyées par le serveur d'API Kubernetes. | resourceId
|
UnschedulablePods
|
Pods ne pouvant pas faire l'objet d'une programmation | nombre | Nombre de pods que le programmeur Kubernetes ne peut pas programmer. Non disponible dans les clusters exécutant une version de Kubernetes antérieure à la version 1.15.x. | resourceId
|
NodeState
|
Etat de noeud | nombre | Nombre de noeuds de calcul dans différents états. | resourceId
|
KubernetesNodeCondition
|
Condition de noeud Kubernetes | nombre |
Nombre de noeuds de processus actifs dans différentes conditions, tel qu'indiqué par le serveur d'API Kubernetes. |
resourceId
|
Utilisation de la console
- Ouvrez le menu de navigation et sélectionnez Services de développeur. Sous Conteneurs et artefacts, sélectionnez Clusters Kubernetes (OKE).
- Sélectionnez la région que vous utilisez avec Kubernetes Engine.
-
Sélectionnez le compartiment contenant le cluster dont vous voulez visualiser les mesures.
La page Clusters affiche tous les clusters du compartiment sélectionné.
- Sélectionnez le nom du cluster dont vous souhaitez visualiser les mesures.
-
Sous Ressources, sélectionnez Mesures.
L'onglet Mesures affiche un graphique pour chaque mesure du cluster émise par l'espace de noms des mesures de moteur Kubernetes. Pour afficher les mesures d'un pool de nœuds du cluster, affichez l'onglet Pools de nœuds, sélectionnez le nom du pool de nœuds et affichez l'onglet Mesures. Pour visualiser les mesures d'un nœud de processus actifs du pool de nœuds, affichez l'onglet Noeuds et sélectionnez le lien Afficher la mesure en regard du nom du nœud de processus actifs. Pour plus d'informations sur les mesures émises, reportez-vous à Mesures disponibles : oci_oke.
Pour plus d'informations sur la surveillance des mesures et l'utilisation des alarmes, reportez-vous à Présentation de Monitoring. Pour plus d'informations sur les notifications relatives aux alarmes, reportez-vous à Présentation de Notifications.
Si vous ne voyez pas les données de mesure d'un cluster que vous attendiez, consultez les causes possibles et les résolutions suivantes.
Problème | Cause possible | Vérification | Résolution |
---|---|---|---|
Je sais que le serveur d'API Kubernetes a renvoyé des réponses d'erreur mais le graphique Nombre de réponses du serveur d'API ne les affiche pas. |
Les réponses ont peut-être été renvoyées en dehors de la période couverte par le graphique Nombre de réponses du serveur d'API. | Vérifiez que l'heure de début et l'heure de fin couvrent la période de renvoi des réponses. | Ajustez Heure de début et Heure de fin, si nécessaire. |
Je sais que le serveur d'API Kubernetes a renvoyé des réponses d'erreur mais le graphique Nombre de réponses du serveur d'API ne les affiche pas, même si les réponses ont été renvoyées pendant la période définie par Heure de début et Heure de fin. | Même si les réponses ont été renvoyées pendant la période définie par Heure de début et Heure de fin, l'axe des X (fenêtre d'affichage des données) peut exclure les réponses. | Assurez-vous que l'axe des X (fenêtre de l'affichage des données) couvre la période de renvoi des réponses. | Ajustez l'axe des X (fenêtre d'affichage des données), si nécessaire. |
Je veux visualiser les données dans les graphiques sous la forme d'une courbe continue dans le temps, mais la courbe présente des interruptions. | Il s'agit d'un comportement attendu. Si aucune donnée de mesure n'apparaît dans l'intervalle sélectionné, la ligne de données est interrompue. | Augmentez l'intervalle (par exemple, de 1 minute à 5 minutes, ou de 1 minute à 1 heure). | Ajustez l'intervalle, si nécessaire. |
Utilisation de l'API
Pour plus d'informations sur l'utilisation de l'API et la signature des demandes, reportez-vous à la documentation relative à l'API REST et à Informations d'identification de sécurité. Pour plus d'informations sur les kits SDK, reportez-vous à Kits SDK et interface de ligne de commande.
- API Monitoring pour les mesures et les alarmes
- API Notifications pour les notifications (utilisées avec des alarmes)