Métricas de Integridade da Instância do Serviço Compute

Você pode monitorar a integridade, a capacidade e o desempenho de suas instâncias de VM (máquina virtual) de computação usando métricas, alarmes e notificações.

Este tópico descreve as métricas emitidas pelo namespace de métricas oci_compute_instance_health.

Recursos: instâncias de VM do serviço Compute.

Visão Geral das Métricas: oci_compute_instance_health

A métrica de integridade da instância de computação a seguir ajuda a monitorar o status, a integridade e a acessibilidade das instâncias de computação.

Status de acessibilidade da instância: A métrica instance_accessibility_status permite monitorar se uma instância de VM não responde. O serviço Compute envia uma solicitação ARP (Address Resolution Protocol) para a VNIC (placa de interface de rede virtual) da instância. Se o ping ARP falhar, a métrica mostrará que a instância não responde.

Observação

A métrica instance_accessibility_status não determina nem informa o motivo específico para a falta de resposta da instância. O teste ARP não fornece informações sobre OS possíveis problemas com o sistema operacional da instância.

Status do Sistema de Arquivos da Instância: A métrica instance_file_system_status permite monitorar se uma instância de VM tem um problema de anomalia no sistema de arquivos. O serviço Compute analisa logs do kernel da VM para determinar o status do volume. Se o volume estiver no status de anomalia, a métrica mostrará o tipo e o volume do problema.

Observação

A métrica instance_file_system_status não determina ou relata o motivo específico para o problema do sistema de arquivos da instância ou problemas com o SO ou volumes da instância.
Usando o MQL para exibir instance_file_system_status
// The query does not specify the volume type, it can be used for general monitoring purpose of read-only volume issues. Users can get volumeType info by inspecting the "volumeType" dimension of the metrics. 
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY"}.max()
// The queries below specify the volume type, they can be used for specific monitoring purposes
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = BOOT_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = DATA_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = UNKNOWN}.max()
Diagnosticando e solucionando problemas de uma instância de VM que não responde
  1. Verifique as métricas de integridade da infraestrutura para determinar se há um problema de infraestrutura em andamento. Se houver um problema de infraestrutura em andamento, aguarde até que o Oracle Cloud Infrastructure resolva o problema e verifique a métrica instance_accessibility_status novamente.
  2. Se não houver um problema de infraestrutura em andamento, é porque a instância provavelmente está com um problema de software ou uma configuração incorreta da rede que deve ser resolvido(a). Confirme se o sistema operacional e a rede estão configurados corretamente. Consulte as sugestões de diagnóstico e solução de problemas do serviço Compute e Networking.
  3. Se as etapas de diagnóstico e solução de problemas dos serviços Compute e Networking não forem bem-sucedidas, você poderá usar uma reinicialização de diagnóstico para recriar uma instância não acessível.

Política de IAM Necessária

Para monitorar recursos, você deve ter o tipo necessário de acesso em uma política gravada por um administrador, quer você esteja usando a Console ou a API REST com um SDK, uma CLI ou outra ferramenta. A política deve conceder acesso aos serviços e aos recursos de monitoramento. Se você tentar executar uma ação e receber uma mensagem de que não tem permissão ou que não está autorizado, entre em contato com o administrador para descobrir em qual tipo de acesso você recebeu e em qual compartimento você precisa trabalhar. Para obter mais informações sobre autorizações de usuário para monitoramento, consulte Políticas do IAM.

Métricas Disponíveis: oci_compute_instance_health

As métricas listadas na tabela a seguir estão automaticamente disponíveis para suas instâncias. Você não precisa ativar o monitoramento na instância para obter essas métricas.

Você também pode usar o serviço Monitoring para criar consultas personalizadas.

As métricas incluem as seguintes dimensões:

resourceDisplayName
O nome amigável da instância.
resourceId
O OCID  da instância.
volumeType
O tipo de volume que tem um problema. Os valores estão entre BOOT_VOLUME, DATA_VOLUME, e UNKNOWN. Quando o valor é UNKNOWN, não é possível determinar o tipo de volume com um problema.
issueType
O tipo de problema do sistema de arquivos. O valor é READ_ONLY quando o volume da instância está no modo READ_ONLY.
Métrica Nome para Exibição da Métrica Unidade Descrição Dimensões
instance_accessibility_status Status de acessibilidade da instância Contagem O status de acessibilidade de uma instância de VM. O valor 1 indica que a instância não responde por causa de um problema com a infraestrutura ou a própria instância. O valor 0 indica que não foi detectado um problema de acessibilidade. Se a instância for interrompida, a métrica não terá um valor.

resourceDisplayName

resourceId

instance_file_system_status Status do sistema de arquivos da instância Contagem

O status do sistema de arquivos de uma instância de VM. O valor 1 indica que a instância tem um problema no sistema de arquivos devido à infraestrutura ou à própria instância. O valor 0 indica que não foi detectado o problema do sistema de arquivos.

Se a instância for interrompida, a métrica não terá um valor.

resourceDisplayName

resourceId

volumeType

issueType

Usando a Console

Para exibir métricas de integridade de computação de uma única instância
  1. Abra o menu de navegação e selecione Computação. Em Compute, selecione Instâncias.
  2. Clique na instância em que você está interessado.
  3. Em Recursos, clique em Métricas.
  4. Na lista Namespace de métricas, selecione oci_compute_instance_health.

    A página Métricas exibe um conjunto padrão de gráficos para a instância atual.

Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Visão Geral do Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte Visão Geral do Serviço Notifications.

Para exibir métricas de integridade de computação de todas as instâncias de um compartimento
  1. Abra o menu de navegação e selecione Observabilidade e Gerenciamento. Em Monitoramento, selecione Métricas do Serviço.
  2. Selecione um compartimento.
  3. Em Namespace de métricas, selecione oci_compute_instance_health.

    A página Métricas do Serviço é atualizada dinamicamente para mostrar gráficos para cada métrica emitida pelo namespace de métricas selecionado.

Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Visão Geral do Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte Visão Geral do Serviço Notifications.