Monitorando a Capacidade do Sistema
É importante rastrear as principais métricas que determinam a capacidade do Private Cloud Appliance para hospedar suas instâncias de computação e o armazenamento que elas usam. Os administradores têm acesso direto ao consumo atual de CPU, memória e espaço de armazenamento.
Os dados detalhados para carregamento do nó de computação e uso de armazenamento podem ser encontrados nos painéis do Grafana. Este tópico explica como acessar as métricas mais críticas diretamente do Service Enclave.
Exibindo Uso de CPU e Memória por Domínio de Falha
Esses procedimentos exibem o número de nós de computação, a quantidade total de memória e memória livre e o número de CPUs virtuais totais e livres para cada domínio de falha.
A linha UNASSIGNED
se refere aos nós de computação que não estão designados no momento a um domínio de falha. Como esses nós de computação não pertencem a um domínio de falha, seu uso de memória e CPU em um domínio de falha é zero.
Para exibir essas informações e muito mais para um nó de computação individual, selecione Configuração de PCA > Unidades de Rack no menu de navegação ou selecione o bloco Unidades de Rack no Painel e clique no nome de um nó de computação na lista.
- Usando a UI da Web de Serviço
-
-
No menu de navegação, selecione PCA Config > Fault Domains.
-
Clique no nome de um domínio de falha para ver as informações somente desse domínio de falha.
-
- Usando a CLI do Serviço
-
Informe o comando
getFaultDomainInfo
.PCA-ADMIN> getFaultDomainInfo Data: id totalCNs totalMemory freeMemory totalvCPUs freevCPUs -- -------- ----------- ---------- ---------- --------- UNASSIGNED 1 0.0 0.0 0 0 FD1 2 1072.0 976.0 176 164 FD2 1 984.0 984.0 120 120 FD3 1 984.0 984.0 120 120
A coluna Notes é omitida no exemplo anterior.
Visualizando o Uso do Espaço em Disco no ZFS Storage Appliance
O Service Enclave executa uma ferramenta de monitoramento de armazenamento chamada gerenciador de pool do ZFS, que pesquisa o ZFS Storage Appliance a cada 60 segundos. Utilizando a CLI de serviço, é possível exibir as informações atuais sobre o uso do espaço em disco disponível em cada pool ZFS. Você também pode definir o limite de uso que aciona uma falha quando o limite é excedido.
- Verificando o status de armazenamento de pools do ZFS
-
Listar pools ZFS.
PCA-ADMIN> list ZfsPool Data: id name -- ---- e898b147-7cf0-4bd0-8b54-e32ec83d04cb PCA_POOL c2f67943-df81-47a5-9713-06768318b623 PCA_POOL_HIGH
Em uma configuração de armazenamento padrão, você só tem um pool. Se o sistema incluir bandejas de disco de alto desempenho, você poderá visualizar as informações de uso de cada pool separadamente.
PCA-ADMIN> show ZfsPool id=e898b147-7cf0-4bd0-8b54-e32ec83d04cb Data: Id = e898b147-7cf0-4bd0-8b54-e32ec83d04cb Type = ZfsPool Pool Status = Online Free Pool = 44879343128576 Total Pool = 70506183131136 Pool Usage Percent = 0.3634693989163486 Name = PCA_POOL Work State = Normal
- Configurando o Limite de Falhas do Gerenciador de Pool ZFS
-
Por padrão, o limite de falha é definido como 80% completo:
usage percentage
0.8.PCA-ADMIN> show ZfsPoolManager Data: Id = a6ca861b-f83a-4032-91c5-bc506394d0de Type = ZfsPoolManager LastRunTime = 2022-10-09 12:17:52,964 UTC Poll Interval (sec) = 60 The minimum Zfs pool usage percentage to trigger a major fault = 0.8 Manager's run state = Running
O exemplo a seguir define o limite de falha como 75% completo:
usageMajorFaultPercent=0.75
.PCA-ADMIN> edit ZfsPoolManager usageMajorFaultPercent=0.75 JobId: 67cfe180-f2a2-4d59-a676-01b3d73cffae