Métricas de Integridade da Instância do Serviço Compute

Você pode monitorar a integridade, a capacidade e o desempenho de suas instâncias de VM (máquina virtual) de computação usando métricas, alarmes e notificações.

Este tópico descreve as métricas emitidas pelo namespace de métricas oci_compute_instance_health.

Recursos: Instâncias da VM do serviço Compute.

Visão Geral das Métricas: oci_compute_instance_health

A métrica de integridade da instância de computação a seguir ajuda a monitorar o status, a integridade e a acessibilidade das instâncias de computação.

Status de acessibilidade da Instância: A métrica instance_accessibility_status permite monitorar se uma instância de VM não responde. O serviço Compute envia uma solicitação de ARP (Address Resolution Protocol) à VNIC (Virtual Network Interface Card) da instância. Se o ping ARP falhar, a métrica mostrará que a instância não responde.

Observação

A métrica instance_accessibility_status não determina nem reporta o motivo específico para a falta de resposta da instância. O teste ARP não fornece informações sobre OS possíveis problemas com o sistema operacional da instância.

Status do Sistema de Arquivos da Instância: A métrica instance_file_system_status permite monitorar se uma instância de VM tem problema de anomalia do sistema de arquivos. O serviço Compute analisa os logs do kernel da VM para determinar o status do volume. Se o volume estiver no status de anomalia, a métrica mostrará o tipo e o volume do problema.

Observação

A métrica instance_file_system_status não determina nem reporta o motivo específico para o problema do sistema de arquivos da instância ou problemas com o SO ou volumes da instância.

Usando o MQL para exibir instance_file_system_status

// The query does not specify the volume type, it can be used for general monitoring purpose of read-only volume issues. Users can get volumeType info by inspecting the "volumeType" dimension of the metrics. 
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY"}.max()
// The queries below specify the volume type, they can be used for specific monitoring purposes
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = BOOT_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = DATA_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = UNKNOWN}.max()

Diagnosticando e Solucionando Problemas de uma instância de VM que não responde

Verifique as métricas de integridade da infraestrutura para determinar se há um problema de infraestrutura em andamento. Se houver um problema em andamento de infraestrutura, aguarde até que a Oracle Cloud Infrastructure resolva o problema e, em seguida, verifique a métrica instance_accessibility_status novamente.
Se não houver um problema em andamento de infraestrutura, a instância provavelmente tem um problema do software ou uma configuração incorreta da rede que você deve resolver. Confirme se o sistema operacional e a rede estão configurados corretamente. Consulte as Sugestões de solução de problemas do serviço Compute e Sugestões de solução de problemas do serviço Networking.
Se as etapas da solução de problemas de Computação e Rede não tiverem êxito, você poderá usar uma reinicialização diagnóstica para reconstruir uma instância inacessível.

Política de IAM Necessária

Para monitorar recursos, você deve ter o tipo necessário de acesso em uma política gravada por um administrador, quer você esteja usando a Console ou a API REST com um SDK, uma CLI ou outra ferramenta. A política deve conceder acesso aos serviços e aos recursos de monitoramento. Se você tentar executar uma ação e receber uma mensagem de que não tem permissão ou que não está autorizado, entre em contato com o administrador para descobrir em qual tipo de acesso você recebeu e em qual compartimento você precisa trabalhar. Para obter mais informações sobre autorizações de usuário para monitoramento, consulte Políticas do IAM.

Métricas Disponíveis: oci_compute_instance_health

As métricas listadas na tabela a seguir estão automaticamente disponíveis para suas instâncias. Você não precisa ativar o monitoramento na instância para obter essas métricas.

Você também pode usar o serviço Monitoring para criar consultas personalizadas.

As métricas inclui as seguintes dimensões:

resourceDisplayName: O nome amigável da instância.
resourceId: O OCID da instância.
volumeType: O tipo de volume que tem um problema. Os valores estão entre BOOT_VOLUME, DATA_VOLUME, e UNKNOWN. Quando o valor é UNKNOWN, não é possível determinar o tipo de volume com um problema.
issueType: O tipo de problema do sistema de arquivos. O valor é READ_ONLY quando o volume da instância está no modo READ_ONLY.


Métrica	Nome para Exibição da Métrica	Unidade	Descrição	Dimensões
`instance_accessibility_status`	Status de acessibilidade da instância	Contagem	O status de acessibilidade de uma instância de VM. O valor 1 indica que a instância não responde por causa de um problema com a infraestrutura ou a própria instância. O valor 0 indica que não foi detectado um problema de acessibilidade. Se a instância for interrompida, a métrica não terá um valor.	`resourceDisplayName` `resourceId`
`instance_file_system_status`	Status do sistema de arquivos da instância	Contagem	O status do sistema de arquivos de uma instância de VM. Um valor 1 indica que a instância tem problema no sistema de arquivos em decorrência da infraestrutura ou da própria instância. Um valor 0 indica que o problema do sistema de arquivos não foi detectado. Se a instância for interrompida, a métrica não terá um valor.	`resourceDisplayName` `resourceId` `volumeType` `issueType`

Usando a Console

Para exibir métricas de integridade de computação de uma única instância

Abra o menu de navegação e selecione Compute. Em Compute, selecione Instâncias.
Clique na instância em que você está interessado.
Em Recursos, clique em Métricas.
Na lista Namespace de métrica, selecione oci_compute_instance_health.

A página Métricas exibe um conjunto padrão de gráficos para a instância atual.

Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Visão Geral do Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte Visão Geral do Serviço Notifications.

Para exibir métricas de integridade de computação de todas as instâncias de um compartimento

Abra o menu de navegação e selecione Observabilidade e Gerenciamento. Em Monitoramento, selecione Métricas de Serviço.
Selecione um compartimento.
Para Namespace de métrica, selecione oci_compute_instance_health.

A página Métricas do Serviço é atualizada dinamicamente para mostrar gráficos para cada métrica emitida pelo namespace de métricas selecionado.

Usando a API

Para obter informações sobre o uso da API e as solicitações de assinatura, consulte Documentação da API REST e Credenciais da Segurança. Para obter informações sobre SDKs, consulte SDKs e a CLI.

Use as seguintes APIs para monitoramento:

API do Serviço Monitoring para métricas e alarmes
API de Notificações para notificações (usada com alarmes)