Monitorando a Capacidade do Sistema

É importante rastrear as principais métricas que determinam a capacidade do Private Cloud Appliance para hospedar suas instâncias de computação e o armazenamento que elas usam. Os administradores têm acesso direto ao consumo atual de CPU, memória e espaço de armazenamento.

Os dados detalhados para carregamento do nó de computação e uso de armazenamento podem ser encontrados nos painéis do Grafana. Este tópico explica como acessar as métricas mais críticas diretamente do Service Enclave.

Exibindo Uso de CPU e Memória por Domínio de Falha

Esses procedimentos exibem o número de nós de computação, a quantidade total de memória e memória livre e o número de CPUs virtuais totais e livres para cada domínio de falha.

A linha UNASSIGNED se refere aos nós de computação que não estão designados no momento a um domínio de falha. Como esses nós de computação não pertencem a um domínio de falha, seu uso de memória e CPU em um domínio de falha é zero.

Para exibir essas informações e muito mais para um nó de computação individual, selecione Configuração de PCA > Unidades de Rack no menu de navegação ou selecione o bloco Unidades de Rack no Painel e clique no nome de um nó de computação na lista.

Usando a UI da Web de Serviço
  1. No menu de navegação, selecione PCA Config > Fault Domains.

  2. Clique no nome de um domínio de falha para ver as informações somente desse domínio de falha.

Usando a CLI do Serviço

Informe o comando getFaultDomainInfo.

PCA-ADMIN> getFaultDomainInfo
Data:
  id           totalCNs   totalMemory   freeMemory   totalvCPUs   freevCPUs
  --           --------   -----------   ----------   ----------   ---------
  UNASSIGNED   1          0.0           0.0          0            0
  FD1          2          1072.0        976.0        176          164
  FD2          1          984.0         984.0        120          120
  FD3          1          984.0         984.0        120          120

A coluna Notes é omitida no exemplo anterior.

Visualizando o Uso do Espaço em Disco no ZFS Storage Appliance

O Service Enclave executa uma ferramenta de monitoramento de armazenamento chamada gerenciador de pool do ZFS, que pesquisa o ZFS Storage Appliance a cada 60 segundos. Utilizando a CLI de serviço, é possível exibir as informações atuais sobre o uso do espaço em disco disponível em cada pool ZFS. Você também pode definir o limite de uso que aciona uma falha quando o limite é excedido.

Verificando o status de armazenamento de pools do ZFS

Listar pools ZFS.

PCA-ADMIN> list ZfsPool
Data:
  id                                     name
  --                                     ----
  e898b147-7cf0-4bd0-8b54-e32ec83d04cb   PCA_POOL
  c2f67943-df81-47a5-9713-06768318b623   PCA_POOL_HIGH

Em uma configuração de armazenamento padrão, você só tem um pool. Se o sistema incluir bandejas de disco de alto desempenho, você poderá visualizar as informações de uso de cada pool separadamente.

PCA-ADMIN> show ZfsPool id=e898b147-7cf0-4bd0-8b54-e32ec83d04cb
Data:
  Id = e898b147-7cf0-4bd0-8b54-e32ec83d04cb
  Type = ZfsPool
  Pool Status = Online
  Free Pool = 44879343128576
  Total Pool = 70506183131136
  Pool Usage Percent = 0.3634693989163486
  Name = PCA_POOL
  Work State = Normal
Configurando o Limite de Falhas do Gerenciador de Pool ZFS

Por padrão, o limite de falha é definido como 80% completo: usage percentage 0.8.

PCA-ADMIN> show ZfsPoolManager
Data:
  Id = a6ca861b-f83a-4032-91c5-bc506394d0de
  Type = ZfsPoolManager
  LastRunTime = 2022-10-09 12:17:52,964 UTC
  Poll Interval (sec) = 60
  The minimum Zfs pool usage percentage to trigger a major fault = 0.8
  Manager's run state = Running

O exemplo a seguir define o limite de falha como 75% completo: usageMajorFaultPercent=0.75.

PCA-ADMIN> edit ZfsPoolManager usageMajorFaultPercent=0.75
JobId: 67cfe180-f2a2-4d59-a676-01b3d73cffae