Supervisión de la capacidad del sistema

Es importante realizar un seguimiento de las métricas clave que determinan la capacidad de Private Cloud Appliance para alojar sus instancias informáticas y el almacenamiento que utilizan. Los administradores tienen acceso directo al consumo actual de CPU, memoria y espacio de almacenamiento.

Los datos detallados para la carga de nodos de cálculo y el uso de almacenamiento se pueden encontrar en los paneles de control de Grafana. En este tema se explica cómo acceder a las métricas más críticas directamente desde el Enclave de servicio.

Visualización del uso de CPU y memoria por dominio de errores

Estos procedimientos muestran el número de nodos de cálculo, la cantidad de memoria total y memoria libre, y el número de CPU virtuales totales y libres para cada dominio de errores.

La fila UNASSIGNED hace referencia a los nodos de cálculo que no están asignados actualmente a un dominio de errores. Debido a que estos nodos de cálculo no pertenecen a un dominio de errores, su uso de memoria y CPU en un dominio de errores es cero.

Para mostrar esta información y mucho más para un nodo de cálculo individual, seleccione PCA Config > Rack Units en el menú de navegación, o bien seleccione el mosaico Rack Units en el panel de control y, a continuación, haga clic en el nombre de un nodo de cálculo en la lista.

Uso de la IU web de servicio
  1. En el menú de navegación, seleccione PCA Config > Fault Domains.

  2. Haga clic en el nombre de un dominio de errores para ver la información solo de ese dominio de errores.

Uso de la CLI del servicio

Introduzca el comando getFaultDomainInfo.

PCA-ADMIN> getFaultDomainInfo
Data:
  id           totalCNs   totalMemory   freeMemory   totalvCPUs   freevCPUs
  --           --------   -----------   ----------   ----------   ---------
  UNASSIGNED   1          0.0           0.0          0            0
  FD1          2          1072.0        976.0        176          164
  FD2          1          984.0         984.0        120          120
  FD3          1          984.0         984.0        120          120

La columna Notas se omite en el ejemplo anterior.

Visualización del uso de espacio en disco en ZFS Storage Appliance

El Enclave de servicio ejecuta una herramienta de supervisión de almacenamiento denominada gestor de agrupaciones ZFS, que sondea ZFS Storage Appliance cada 60 segundos. Con la CLI de servicio, puede mostrar información actual sobre el uso del espacio en disco disponible en cada agrupación ZFS. También puede definir el umbral de uso que dispara un fallo cuando se supera el umbral.

Comprobación del estado de almacenamiento de agrupaciones de ZFS

Mostrar agrupaciones ZFS.

PCA-ADMIN> list ZfsPool
Data:
  id                                     name
  --                                     ----
  e898b147-7cf0-4bd0-8b54-e32ec83d04cb   PCA_POOL
  c2f67943-df81-47a5-9713-06768318b623   PCA_POOL_HIGH

En una configuración de almacenamiento estándar, solo tiene una agrupación. Si el sistema incluye bandejas de disco de alto rendimiento, puede ver la información de uso de cada agrupación por separado.

PCA-ADMIN> show ZfsPool id=e898b147-7cf0-4bd0-8b54-e32ec83d04cb
Data:
  Id = e898b147-7cf0-4bd0-8b54-e32ec83d04cb
  Type = ZfsPool
  Pool Status = Online
  Free Pool = 44879343128576
  Total Pool = 70506183131136
  Pool Usage Percent = 0.3634693989163486
  Name = PCA_POOL
  Work State = Normal
Configuración del umbral de fallos del gestor de agrupaciones ZFS

Por defecto, el umbral de fallo se define en el 80 % completo: usage percentage 0,8.

PCA-ADMIN> show ZfsPoolManager
Data:
  Id = a6ca861b-f83a-4032-91c5-bc506394d0de
  Type = ZfsPoolManager
  LastRunTime = 2022-10-09 12:17:52,964 UTC
  Poll Interval (sec) = 60
  The minimum Zfs pool usage percentage to trigger a major fault = 0.8
  Manager's run state = Running

En el siguiente ejemplo, se define el umbral de fallos en un 75 % completo: usageMajorFaultPercent=0.75.

PCA-ADMIN> edit ZfsPoolManager usageMajorFaultPercent=0.75
JobId: 67cfe180-f2a2-4d59-a676-01b3d73cffae