Métricas da Instância do Serviço Compute
Você pode monitorar a integridade, a capacidade e o desempenho de suas instâncias de computação usando métricas, alarmes e notificações.
Este tópico descreve as métricas emitidas pelo namespace de métricas oci_computeagent
(o plug-in Compute Instance Monitoring nas instâncias de computação).
Você pode exibir essas métricas para instâncias de computação individuais e para todas as instâncias em um pool de instâncias.
Recursos: Instâncias de computação ativadas para Monitoramento
Visão Geral das Métricas de uma Instância e Recursos Relacionados
Esta seção fornece uma visão geral dos diferentes tipos de métricas disponíveis para uma instância e seus dispositivos de armazenamento e rede. Consulte o diagrama e a tabela a seguir para obter um resumo.
Namespace de Métricas | ID do Recurso | Onde Medido | Métricas Disponíveis |
---|---|---|---|
oci_computeagent
|
OCID da Instância | Na instância. As métricas deste namespace são agregadas entre todos os recursos relacionados na instância. Por exemplo, DiskBytesRead é agregado em todos os volumes de armazenamento anexados da instância, e NetworkBytesIn é agregado em todas as VNICs anexadas da instância. |
Consulte Métricas Disponíveis: oci_computeagent. |
oci_blockstore
|
OCID do volume em blocos ou de inicialização | Pelo serviço Block Volume. As métricas são para um volume individual (volume de inicialização ou volume em blocos). | Consulte Métricas do Serviço Block Volume. |
oci_vcn
|
OCID da VNIC | Pelo serviço Networking. As métricas são de uma VNIC individual. |
Consulte Métricas de VNIC. |
Antes de Começar
- Políticas do serviço IAM: Para monitorar recursos, você deve ter o tipo necessário de acesso em uma política gravada por um administrador, quer esteja usando a Console ou a API REST com um SDK, CLI ou outra ferramenta. A política deve fornecer acesso aos serviços de monitoramento, bem como aos recursos que estão sendo monitorados. Se você tentar executar uma ação e receber uma mensagem de que não tem permissão ou não está autorizado, entre em contato com o administrador para descobrir em que tipo de acesso foi concedido e em qual compartimento você precisa trabalhar. Para obter mais informações sobre autorizações do usuário para monitoramento, consulte Políticas do Serviço IAM.
- Métricas existentes no Monitoring: Os recursos que você deseja monitorar devem emitir métricas para o serviço Monitoring.
- Instâncias do serviço Compute: Para emitir métricas, o plug-in de Monitoramento de Instâncias do Serviço Compute deve estar ativado na instância e os plug-ins devem estar em execução. A instância também deve ter um gateway de serviço ou um endereço IP público para enviar métricas ao serviço Monitoring. Para obter mais informações, consulte Ativando o Monitoramento de Instâncias do Serviço Compute.
Métricas Disponíveis: oci_computeagent
As métricas da instância de computação ajudam você a medir o nível de atividade e o throughput das instâncias de computação. As métricas listadas na tabela a seguir estão disponíveis para qualquer instância de computação com monitoramento ativado. Para obter essas métricas, ative o monitoramento na instância.
As métricas deste namespace são agregadas entre todos os recursos relacionados na instância. Por exemplo, DiskBytesRead
é agregado em todos os volumes de armazenamento anexados da instância, e NetworkBytesIn
é agregado em todas as VNICs anexadas da instância.
Para métricas emitidas pelo namespace de métricas oci_computeagent
, os pontos de dados são amostrados a cada dez segundos. Um batch de seis pontos de dados é emitido a cada minuto. Portanto, para granularidade a cada minuto, a contagem agregada é sempre seis, a soma agregada é a soma dos seis pontos de dados e a média agregada é a média dos seis pontos de dados.
Você também pode usar o serviço Monitoring para criar consultas personalizadas.
Cada métrica inclui as seguintes dimensões:
- availabilityDomain
- O domínio de disponibilidade no qual a instância reside.
- faultDomain
- O domínio de falha no qual a instância reside.
- imageId
- O OCID da imagem da instância.
- instancePoolId
- O pool de instâncias ao qual a instância pertence.
- região
- A região onde a instância reside.
- resourceDisplayName
- O nome amigável da instância.
- resourceId
- O OCID da instância.
- forma
- A forma da instância.
Métrica | Nome para Exibição da Métrica | Unidade | Descrição | Dimensões |
---|---|---|---|---|
CpuUtilization
|
Utilização de CPU | percentual |
Nível de atividade da CPU. Expresso como um percentual do tempo total. Para pools de instâncias, o valor é médio entre todas as instâncias do pool. |
|
DiskBytesRead 1, 3 |
Bytes de Leitura de Disco | bytes | Throughput de leitura. Expresso como bytes lidos por intervalo. | |
DiskBytesWritten 1, 3 |
Bytes de Gravação em Disco | bytes | Throughput de gravação. Expresso como bytes gravados por intervalo. | |
DiskIopsRead 1, 3 |
Entrada/Saída de Leitura de Disco | operações | Nível de atividade de leituras de Entrada/Saída. Expresso como leituras por intervalo. | |
DiskIopsWritten 1, 3 |
Entrada/Saída de Gravação em Disco | operações | Nível de atividade de gravações de Entrada/Saída. Expresso como gravações por intervalo. | |
LoadAverage |
Média de Carga | número de processos | Carga média do sistema calculada ao longo de um período de 1 minuto. | |
MemoryAllocationStalls |
Problemas de alocação de memória | número de paralisações | Número de vezes em que a reivindicação de página foi chamada diretamente. | |
MemoryUtilization 1 |
Utilização de Memória | percentual |
Espaço usado atualmente. Medido por páginas. Expresso como um percentual de páginas utilizadas. Para pools de instâncias, o valor é médio entre todas as instâncias do pool. |
|
NetworksBytesIn 1, 2 |
Bytes Recebidos na Rede | bytes |
Throughput de recebimento de rede. Expresso como bytes recebidos. |
|
NetworksBytesOut 1, 2
|
Bytes Transmitidos na Rede | bytes | Throughput de transmissão de rede. Expresso como bytes transmitidos. | |
1 Esta métrica é um contador cumulativo que mostra um comportamento uniformemente crescente para cada sessão do software Oracle Cloud Agent, fazendo a redefinição quando o sistema operacional é reiniciado. 2 O serviço Networking fornece mais métricas (no namespace de métricas 3 O serviço Block Volume fornece mais métricas (no namespace de métricas |
Métricas Disponíveis: gpu_infrastructure_health
As métricas da instância de computação ajudam você a medir o nível de atividade e o throughput das instâncias de computação. As métricas listadas na tabela a seguir estão disponíveis para qualquer instância de computação com monitoramento ativado. Para obter essas métricas, ative o monitoramento na instância.
As métricas deste namespace são agregadas entre todos os recursos relacionados na instância. Por exemplo, DiskBytesRead
é agregado em todos os volumes de armazenamento anexados da instância, e NetworkBytesIn
é agregado em todas as VNICs anexadas da instância.
Para métricas emitidas pelo namespace de métricas gpu_infrastructure_health
, os pontos de dados são amostrados a cada dez segundos. Um batch de seis pontos de dados é emitido a cada minuto. Portanto, para granularidade a cada minuto, a contagem agregada é sempre seis, a soma agregada é a soma dos seis pontos de dados e a média agregada é a média dos seis pontos de dados.
Você também pode usar o serviço Monitoring para criar consultas personalizadas.
Cada métrica inclui as seguintes dimensões:
- componente
- GPU ou rdma_nic
- timestamp
- Horário UTC em que o payload/pulsação cardíaca é emitido
- versão
- O número da versão do payload para compatibilidade
Métrica | Nome para Exibição da Métrica | Unidade | Descrição | Dimensões |
---|---|---|---|---|
GpuUtilization
|
Utilização de GPU | percentual |
Nível de atividade da GPU. Expresso como um percentual do tempo total. Para pools de instâncias, o valor é médio entre todas as instâncias do pool. |
|
GpuMemoryUtilization |
Utilização de memória de GPU | percentual | A porcentagem do recurso de memória de GPU em uso. | |
GpuPowerDraw |
Sorteio de energia da GPU | inteiro | A quantidade de potência de GPU usada. | |
GpuTemperature |
Temperatura da GPU | inteiro | A temperatura da GPU informada. | |
GpuEccSingleBitErrors |
Erros de bit único da GPU | inteiro | O número de erros de ECC de bit único de GPU relatados. | |
GpuEccDoubleBitErrors |
Erros de dois bits da GPU | inteiro | O número de erros de ECC de bit duplo de GPU relatados. | |
1 Esta métrica é um contador cumulativo que mostra um comportamento uniformemente crescente para cada sessão do software Oracle Cloud Agent, fazendo a redefinição quando o sistema operacional é reiniciado. 2 O serviço Networking fornece mais métricas (no namespace de métricas 3 O serviço Block Volume fornece mais métricas (no namespace de métricas |
Métricas Disponíveis: rdma_infrastructure_health
As métricas da instância de computação ajudam você a medir o nível de atividade e o throughput das instâncias de computação. As métricas listadas na tabela a seguir estão disponíveis para qualquer instância de computação com monitoramento ativado. Para obter essas métricas, ative o monitoramento na instância.
As métricas deste namespace são agregadas entre todos os recursos relacionados na instância. Por exemplo, DiskBytesRead
é agregado em todos os volumes de armazenamento anexados da instância, e NetworkBytesIn
é agregado em todas as VNICs anexadas da instância.
Para métricas emitidas pelo namespace de métricas rdma_infrastructure_health
, os pontos de dados são amostrados a cada dez segundos. Um batch de seis pontos de dados é emitido a cada minuto. Portanto, para granularidade a cada minuto, a contagem agregada é sempre seis, a soma agregada é a soma dos seis pontos de dados e a média agregada é a média dos seis pontos de dados.
Você também pode usar o serviço Monitoring para criar consultas personalizadas.
Cada métrica inclui as seguintes dimensões:
- componente
- GPU ou rdma_nic
- timestamp
- Horário UTC em que o payload/pulsação cardíaca é emitido
- versão
- O número da versão do payload para compatibilidade
Métrica | Nome para Exibição da Métrica | Unidade | Descrição | Dimensões |
---|---|---|---|---|
RdmaTxBytes
|
Bytes transmitidos pela rede agregada RDMA | bytes | Os bytes transmitidos na interface RDMA. |
|
RdmaRxBytes |
RDMA - bytes de recebimento de rede agregada | bytes | Os bytes recebidos na interface RDMA. | |
RdmaTxPackets |
Pacotes de transmissão de rede agregada RDMA | inteiro | O número de pacotes transmitidos da interface RDMA | |
RdmaRxPackets |
Pacotes de recebimento de rede agregada RDMA | inteiro | O número de pacotes recebidos da interface RDMA | |
1 Esta métrica é um contador cumulativo que mostra um comportamento uniformemente crescente para cada sessão do software Oracle Cloud Agent, fazendo a redefinição quando o sistema operacional é reiniciado. 2 O serviço Networking fornece mais métricas (no namespace de métricas 3 O serviço Block Volume fornece mais métricas (no namespace de métricas |
Usando a Console
- Abra o menu de navegação e clique em Compute. Em Compute, clique em Instâncias.
- Clique na instância em que você está interessado.
- Em Recursos, clique em Métricas.
-
Na lista Namespace de métricas, selecione oci_computeagent.
A página Métricas exibe um conjunto padrão de gráficos para a instância atual.
Não está visualizando gráficos de métrica para a instância?Se você não vir gráficos de métricas, pode ser que a instância não esteja emitindo métricas. Consulte as possíveis causas e soluções a seguir.
Possível causa Como verificar Solução O plug-in Compute Instance Monitoring está desativado na instância ou os plug-ins foram interrompidos. Verifique as propriedades da instância. Ative o plug-in Compute Instance Monitoring e inicie todos os plug-ins. A instância não pode acessar o serviço Monitoring porque sua VCN não usa a internet. Verifique o endereço IP da instância. Caso não seja público, será necessário um gateway de serviço. Configure um gateway de serviço. A instância não usa uma imagem suportada. Verifique as imagens suportadas. Crie uma instância com uma imagem suportada. Imagens mais antigas e imagens personalizadas: Não existe software Oracle Cloud Agent na instância. Conecte-se à instância e procure o software. Instale o software Oracle Cloud Agent. Outra coisa está errada com o software Oracle Cloud Agent. (não aplicável) Siga as etapas de solução de problemas do Oracle Cloud Agent. Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Visão Geral do Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte Visão Geral do Serviço Notifications.
- Abra o menu de navegação e clique em Observabilidade e Gerenciamento. Em Monitoramento, clique em Métricas de Serviço.
- Selecione um compartimento.
-
Para Namespace de métricas, selecione oci_computeagent.
A página Métricas do Serviço atualiza dinamicamente a página para mostrar gráficos para cada métrica emitida pelo namespace de métricas selecionado.
Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Visão Geral do Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte Visão Geral do Serviço Notifications.
- Abra o menu de navegação e clique em Compute. Em Compute, clique em Pools de Instâncias.
- Clique no pool de instâncias em que você está interessado.
- Em Recursos, clique em Métricas.
-
Na lista Namespace de métricas, selecione oci_computeagent.
A página Métricas exibe um conjunto padrão de gráficos para o pool de instâncias atual.
Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Visão Geral do Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte Visão Geral do Serviço Notifications.
Usando a API
Para obter informações sobre como usar a API e assinar solicitações, consulte a documentação da API REST e Credenciais de Segurança. Para obter informações sobre SDKs, consulte SDKs e a CLI.
- API do Serviço Monitoring para métricas e alarmes
- API do Serviço Notifications para notificações (usado com alarmes)