Métricas de Integridade da Instância do Serviço Compute
Você pode monitorar a integridade, a capacidade e o desempenho de suas instâncias de VM (máquina virtual) de computação usando métricas, alarmes e notificações.
Este tópico descreve as métricas emitidas pelo namespace de métricas oci_compute_instance_health
.
Recursos: instâncias de VM do serviço Compute.
Visão Geral das Métricas: oci_compute_instance_health
A métrica de integridade da instância de computação a seguir ajuda a monitorar o status, a integridade e a acessibilidade das instâncias de computação.
Status de acessibilidade da instância: A métrica instance_accessibility_status
permite monitorar se uma instância de VM não responde. O serviço Compute envia uma solicitação ARP (Address Resolution Protocol) para a VNIC (placa de interface de rede virtual) da instância. Se o ping ARP falhar, a métrica mostrará que a instância não responde.
A métrica
instance_accessibility_status
não determina nem informa o motivo específico para a falta de resposta da instância. O teste ARP não fornece informações sobre OS possíveis problemas com o sistema operacional da instância.Status do Sistema de Arquivos da Instância: A métrica instance_file_system_status
permite monitorar se uma instância de VM tem um problema de anomalia no sistema de arquivos. O serviço Compute analisa logs do kernel da VM para determinar o status do volume. Se o volume estiver no status de anomalia, a métrica mostrará o tipo e o volume do problema.
A métrica
instance_file_system_status
não determina ou relata o motivo específico para o problema do sistema de arquivos da instância ou problemas com o SO ou volumes da instância.// The query does not specify the volume type, it can be used for general monitoring purpose of read-only volume issues. Users can get volumeType info by inspecting the "volumeType" dimension of the metrics.
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY"}.max()
// The queries below specify the volume type, they can be used for specific monitoring purposes
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = BOOT_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = DATA_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = UNKNOWN}.max()
- Verifique as métricas de integridade da infraestrutura para determinar se há um problema de infraestrutura em andamento. Se houver um problema de infraestrutura em andamento, aguarde até que o Oracle Cloud Infrastructure resolva o problema e verifique a métrica
instance_accessibility_status
novamente. - Se não houver um problema de infraestrutura em andamento, é porque a instância provavelmente está com um problema de software ou uma configuração incorreta da rede que deve ser resolvido(a). Confirme se o sistema operacional e a rede estão configurados corretamente. Consulte as sugestões de diagnóstico e solução de problemas do serviço Compute e Networking.
- Se as etapas de diagnóstico e solução de problemas dos serviços Compute e Networking não forem bem-sucedidas, você poderá usar uma reinicialização de diagnóstico para recriar uma instância não acessível.
Política de IAM Necessária
Para monitorar recursos, você deve ter o tipo necessário de acesso em uma política gravada por um administrador, quer você esteja usando a Console ou a API REST com um SDK, uma CLI ou outra ferramenta. A política deve conceder acesso aos serviços e aos recursos de monitoramento. Se você tentar executar uma ação e receber uma mensagem de que não tem permissão ou que não está autorizado, entre em contato com o administrador para descobrir em qual tipo de acesso você recebeu e em qual compartimento você precisa trabalhar. Para obter mais informações sobre autorizações de usuário para monitoramento, consulte Políticas do IAM.
Métricas Disponíveis: oci_compute_instance_health
As métricas listadas na tabela a seguir estão automaticamente disponíveis para suas instâncias. Você não precisa ativar o monitoramento na instância para obter essas métricas.
Você também pode usar o serviço Monitoring para criar consultas personalizadas.
As métricas incluem as seguintes dimensões:
- resourceDisplayName
- O nome amigável da instância.
- resourceId
- O OCID da instância.
- volumeType
- O tipo de volume que tem um problema. Os valores estão entre
BOOT_VOLUME, DATA_VOLUME,
eUNKNOWN
. Quando o valor éUNKNOWN
, não é possível determinar o tipo de volume com um problema. - issueType
- O tipo de problema do sistema de arquivos. O valor é
READ_ONLY
quando o volume da instância está no modoREAD_ONLY
.
Métrica | Nome para Exibição da Métrica | Unidade | Descrição | Dimensões |
---|---|---|---|---|
instance_accessibility_status
|
Status de acessibilidade da instância | Contagem | O status de acessibilidade de uma instância de VM. O valor 1 indica que a instância não responde por causa de um problema com a infraestrutura ou a própria instância. O valor 0 indica que não foi detectado um problema de acessibilidade. Se a instância for interrompida, a métrica não terá um valor. |
|
instance_file_system_status
|
Status do sistema de arquivos da instância | Contagem |
O status do sistema de arquivos de uma instância de VM. O valor 1 indica que a instância tem um problema no sistema de arquivos devido à infraestrutura ou à própria instância. O valor 0 indica que não foi detectado o problema do sistema de arquivos. Se a instância for interrompida, a métrica não terá um valor. |
|
Usando a Console
- Abra o menu de navegação e selecione Computação. Em Compute, selecione Instâncias.
- Clique na instância em que você está interessado.
- Em Recursos, clique em Métricas.
-
Na lista Namespace de métricas, selecione oci_compute_instance_health.
A página Métricas exibe um conjunto padrão de gráficos para a instância atual.
Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Visão Geral do Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte Visão Geral do Serviço Notifications.
- Abra o menu de navegação e selecione Observabilidade e Gerenciamento. Em Monitoramento, selecione Métricas do Serviço.
- Selecione um compartimento.
-
Em Namespace de métricas, selecione oci_compute_instance_health.
A página Métricas do Serviço é atualizada dinamicamente para mostrar gráficos para cada métrica emitida pelo namespace de métricas selecionado.
Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Visão Geral do Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte Visão Geral do Serviço Notifications.
Usando a API
Para obter informações sobre como usar a API e assinar solicitações, consulte a documentação da API REST e Credenciais de Segurança. Para obter informações sobre SDKs, consulte SDKs e a CLI.
- API do Serviço Monitoring para métricas e alarmes
- API do Serviço Notifications para notificações (usado com alarmes)