Supervisión de la capacidad del sistema
Es importante realizar un seguimiento de las métricas clave que determinan la capacidad de Private Cloud Appliance para alojar sus instancias informáticas y el almacenamiento que utilizan. Los administradores tienen acceso directo al consumo actual de CPU, memoria y espacio de almacenamiento.
Los datos detallados para la carga de nodos de cálculo y el uso de almacenamiento se pueden encontrar en los paneles de control de Grafana. En este tema se explica cómo acceder a las métricas más críticas directamente desde el Enclave de servicio.
Visualización del uso de CPU y memoria por dominio de errores
Estos procedimientos muestran el número de nodos de cálculo, la cantidad de memoria total y memoria libre, y el número de CPU virtuales totales y libres para cada dominio de errores.
La fila UNASSIGNED hace referencia a los nodos de cálculo que no están asignados actualmente a un dominio de errores. Debido a que estos nodos de cálculo no pertenecen a un dominio de errores, su uso de memoria y CPU en un dominio de errores es cero.
Para mostrar esta información y mucho más para un nodo de cálculo individual, seleccione PCA Config > Rack Units en el menú de navegación, o bien seleccione el mosaico Rack Units en el panel de control y, a continuación, haga clic en el nombre de un nodo de cálculo en la lista.
- Uso de la IU web de servicio
-
-
En el menú de navegación, seleccione PCA Config > Fault Domains.
-
Haga clic en el nombre de un dominio de errores para ver la información solo de ese dominio de errores.
-
- Uso de la CLI del servicio
-
Introduzca el comando
getFaultDomainInfo.PCA-ADMIN> getFaultDomainInfo Data: id totalCNs totalMemory freeMemory totalvCPUs freevCPUs -- -------- ----------- ---------- ---------- --------- UNASSIGNED 1 0.0 0.0 0 0 FD1 2 1072.0 976.0 176 164 FD2 1 984.0 984.0 120 120 FD3 1 984.0 984.0 120 120La columna Notas se omite en el ejemplo anterior.
Visualización del uso de espacio en disco en ZFS Storage Appliance
El Enclave de servicio ejecuta una herramienta de supervisión de almacenamiento denominada gestor de agrupaciones ZFS, que sondea ZFS Storage Appliance cada 60 segundos. Con la CLI de servicio, puede mostrar información actual sobre el uso del espacio en disco disponible en cada agrupación ZFS. También puede definir el umbral de uso que dispara un fallo cuando se supera el umbral.
- Comprobación del estado de almacenamiento de agrupaciones de ZFS
-
Mostrar agrupaciones ZFS.
PCA-ADMIN> list ZfsPool Data: id name -- ---- e898b147-7cf0-4bd0-8b54-e32ec83d04cb PCA_POOL c2f67943-df81-47a5-9713-06768318b623 PCA_POOL_HIGHEn una configuración de almacenamiento estándar, solo tiene una agrupación. Si el sistema incluye bandejas de disco de alto rendimiento, puede ver la información de uso de cada agrupación por separado.
PCA-ADMIN> show ZfsPool id=e898b147-7cf0-4bd0-8b54-e32ec83d04cb Data: Id = e898b147-7cf0-4bd0-8b54-e32ec83d04cb Type = ZfsPool Pool Status = Online Free Pool = 44879343128576 Total Pool = 70506183131136 Pool Usage Percent = 0.3634693989163486 Name = PCA_POOL Work State = Normal - Configuración del umbral de fallos del gestor de agrupaciones ZFS
-
Por defecto, el umbral de fallo se define en el 80 % completo:
usage percentage0,8.PCA-ADMIN> show ZfsPoolManager Data: Id = a6ca861b-f83a-4032-91c5-bc506394d0de Type = ZfsPoolManager LastRunTime = 2022-10-09 12:17:52,964 UTC Poll Interval (sec) = 60 The minimum Zfs pool usage percentage to trigger a major fault = 0.8 Manager's run state = RunningEn el siguiente ejemplo, se define el umbral de fallos en un 75 % completo:
usageMajorFaultPercent=0.75.PCA-ADMIN> edit ZfsPoolManager usageMajorFaultPercent=0.75 JobId: 67cfe180-f2a2-4d59-a676-01b3d73cffae