Monitorar Métricas para Recursos de Cluster de VMs

Com métricas, alarmes e notificações, você pode monitorar a integridade, a capacidade e o desempenho dos seus clusters de VMs e bancos de dados. Para exibir métricas, você pode usar a Console do Oracle Cloud Infrastructure, bem como as APIs do Monitoring e do Database Management.

Observação: Para exibir métricas, você deve ter o acesso obrigatório conforme especificado em uma política do Oracle Cloud Infrastructure (quer esteja usando a Console, a API REST ou outra ferramenta). Consulte Conceitos Básicos sobre Políticas para obter informações sobre políticas.

ADVERTÊNCIA:

As métricas, os eventos e os eventos de auditoria não serão enviados se o CRS (Cluster Ready Services) não estiver em execução antes de o AHF (Autonomous Health Framework) ser iniciado.

Pré-requisitos de Uso de Métricas

Os pré-requisitos a seguir são obrigatórios para que as métricas fluam do cluster de VMs.

  1. As métricas nos clusters de VMs dependem do agente Oracle TFA (Trace File Analyzer). Verifique se esses componentes estão em execução. O AHF versão 22.2.4 ou posterior é obrigatório para capturar métricas dos clusters de VM. Para iniciar, interromper ou verificar o status do TFA, consulte Gerenciar o Oracle Trace File Analyzer.
  2. Para exibir as métricas na Console do Oracle Cloud Infrastructure, o flag do TFA defaultocimonitoring deve ser definido como ON. Esse flag é definido como ON por padrão e você não precisa executar nenhuma ação para defini-lo. Se você não estiver vendo métricas na Console, como usuário root na VM convidada, verifique se o flag está definido como ON.
    tfactl get defaultocimonitoring
    .---------------------------------------------------------------------.
    |                             <host name>                             |
    +-------------------------------------------------------------+-------+
    | Configuration Parameter                                     | Value |
    +-------------------------------------------------------------+-------+
    | Send CEF metrics to OCI Monitoring ( defaultOciMonitoring ) | ON    |
    '-------------------------------------------------------------+-------'
    Se o flag defaultocimonitoring estiver definido como OFF, execute o comando tfactl set defaultocimonitoring=on ou tfactl set defaultocimonitoring=ON para ativá-lo:
    tfactl set defaultocimonitoring=on
    Successfully set defaultOciMonitoring=ON
    .---------------------------------------------------------------------.
    |                             <host name>                             |
    +-------------------------------------------------------------+-------+
    | Configuration Parameter                                     | Value |
    +-------------------------------------------------------------+-------+
    | Send CEF metrics to OCI Monitoring ( defaultOciMonitoring ) | ON    |
    '-------------------------------------------------------------+-------'
  3. As configurações de rede a seguir são necessárias.
    1. Regras de saída para tráfego de saída: As regras de saída padrão são suficientes para ativar o caminho de rede necessário: Para obter mais informações, consulte Lista de Segurança Padrão. Se você tiver bloqueado o tráfego de saída modificando as regras de saída padrão na sua VCN (Rede Virtual na Nuvem), precisará reverter as definições para permitir o tráfego de saída. A regra de saída padrão que permite tráfego de saída (conforme mostrado nas Regras Obrigatórias para Redes de Cliente e de Backup ) é a seguinte:
      • Sem monitoramento de estado: Não (Todas as regras devem ser com monitoramento de estado)
      • Tipo de Destino: CIDR
      • CIDR de Destino: Todos os Serviços de <region> no Oracle Services Network
      • Protocolo IP: 443 (HTTPS)
    2. IP Público e Gateway de Serviço: A instância de computação deve ter um endereço IP público ou um gateway de serviço para poder enviar métricas da instância de computação ao serviço Monitoring.

      Se a instância não tiver um endereço IP público, configure um gateway de serviço na VCN (rede virtual na nuvem). O gateway de serviço permite que a instância envie métricas de instância de computação para o serviço Monitoring sem que o tráfego passe pela internet. Veja aqui as observações especiais para configurar o gateway de serviço para acessar o serviço Monitoring:

      1. Ao criar o gateway de serviço, ative o label de serviço chamado Todos os Serviços de <region> no Oracle Services Network. Ele inclui o serviço Monitoring.
      2. Ao configurar o roteamento da sub-rede que contém a instância, configure uma regra de roteamento com o Tipo de Destino definido como Gateway de Serviço e o Serviço de Destino definido como Todos os Serviços de <region> no Oracle Services Network.

        Para ver instruções, consulte Acesso aos Serviços Oracle: Gateway de Serviço.

Exibir Métricas do Cluster de VMs

Execute as etapas a seguir para exibir as métricas das VMs Convidadas usando a console.

Observação

Quando houver um problema de rede e o TFA (Oracle Trace File Analyzer) não puder publicar métricas, o TFA aguardará uma hora para tentar publicar as métricas novamente. Isso é necessário para evitar a criação de um backlog do processamento de métricas no TFA.

Potencialmente, uma hora de métricas será perdida entre a restauração da rede e a primeira métrica publicada.

  1. Abra o menu de navegação. Clique em Oracle Database e, em seguida, clique em Oracle Exadata Database Service on Dedicated Infrastructure.
  2. Escolha o Compartimento. Uma lista de clusters de VMs é exibida.
  3. Na lista de clusters de VMs, clique no cluster de VMs cujas métricas você deseja exibir. Os detalhes do cluster de VMs que você selecionou são exibidos.
  4. Na seção Recursos, clique em Métricas.

    Um gráfico para cada métrica é exibido. Por padrão, as métricas da última hora são exibidas.

    Você só pode selecionar o namespace oci_database_cluster na lista drop-down Namespace de métricas.

  5. Se quiser alterar o intervalo, selecione a hora inicial e a hora final necessárias. Se preferir, selecione o intervalo no menu drop-down Seleções Rápidas. As métricas são atualizadas imediatamente para o intervalo selecionado.
  6. Para cada métrica, você pode escolher o intervalo e a estatística de forma independente.
    • Intervalo - O período no qual a métrica é calculada.
    • Estatística - O método matemático pelo qual a métrica é calculada.
  7. Para cada métrica, você pode escolher as opções a seguir no menu drop-down 'Opções'.
    • Exibir Consulta no Metrics Explorer

    • Copiar URL do Gráfico

    • Copiar Consulta (MQL)

    • Criar um Alarme nesta Consulta
    • View de Tabela

Para obter informações detalhadas sobre várias opções para exibir o gráfico de métricas, consulte Exibindo Gráficos de Métrica Padrão.

Exibir Métricas para um Banco de Dados

Execute as etapas a seguir para exibir as métricas de um banco de dados usando a console.

Observação

Quando houver um problema de rede e o TFA (Oracle Trace File Analyzer) não puder publicar métricas, o TFA aguardará uma hora para tentar publicar as métricas novamente. Isso é necessário para evitar a criação de um backlog do processamento de métricas no TFA.

Potencialmente, uma hora de métricas será perdida entre a restauração da rede e a primeira métrica publicada.

  1. Abra o menu de navegação. Clique no Oracle Database e, em seguida, clique em Exadata no Oracle Public Cloud.
  2. Escolha o Compartimento. Uma lista de clusters de VMs é exibida.
  3. Na lista de clusters de VMs, clique no cluster que contém o banco de dados cujas métricas você deseja exibir. Os detalhes do cluster de VMs que você selecionou são exibidos.
  4. Na lista de bancos de dados, clique no banco de dados cujas métricas você deseja exibir.
  5. Na seção Recursos, clique em Métricas.

    Um gráfico para cada métrica é exibido. Por padrão, as métricas da última hora são exibidas.

  6. Selecione um namespace no Namespace de métricas de onde você deseja exibir métricas.
    Observação

    • Quando o Database Management estiver ativado, você terá a opção de escolher entre o namespace oci_database ou oracle_oci_database.
    • Quando o Database Management estiver desativado, você só poderá exibir métricas do namespace oci_database.
  7. Se quiser alterar o intervalo, selecione a hora inicial e a hora final necessárias. Se preferir, selecione o intervalo no menu drop-down Seleções Rápidas. As métricas são atualizadas imediatamente para o intervalo selecionado.
  8. Para cada métrica, você pode escolher o intervalo e a estatística de forma independente.
    • Intervalo - O período no qual a métrica é calculada.
    • Estatística - O método matemático pelo qual a métrica é calculada.
  9. Para cada métrica, você pode escolher as opções a seguir no menu drop-down 'Opções'.
    • Exibir Consulta no Metrics Explorer
    • Copiar URL do Gráfico
    • Copiar Consulta (MQL)
    • Criar um Alarme nesta Consulta
    • View de Tabela

Para obter informações detalhadas sobre várias opções para exibir o gráfico de métricas, consulte Exibindo Gráficos de Métrica Padrão.

Exibir Métricas de um PDB

  1. Abra o menu de navegação. Clique no Oracle Database e, em seguida, clique em Exadata no Oracle Public Cloud.
  2. Escolha o Compartimento. Uma lista de clusters de VMs é exibida.
  3. Na lista de clusters de VMs, clique no cluster que contém o banco de dados cujas métricas você deseja exibir. Os detalhes do cluster de VMs que você selecionou são exibidos.
  4. Na lista de bancos de dados, clique no banco de dados que contém o PBD cujas métricas você deseja exibir.
  5. Em Recursos, clique em Bancos de Dados Plugáveis.
  6. Na lista de clusters de VMs, clique no PDB cujas métricas você deseja exibir.
  7. Selecione um namespace no Namespace de métricas de onde você deseja exibir métricas.
    Observação

    • Quando o Database Management estiver ativado, você terá a opção de escolher o namespace oracle_oci_database.
    • Quando o Database Management estiver desativado, o sistema exibirá um banner solicitando que você ative o Database Management para fornecer métricas.

Exibir Métricas de Clusters de VMs em um Compartimento

Execute as etapas a seguir para exibir as métricas dos bancos de dados de um compartimento usando a console.

Observação

Quando houver um problema de rede e o TFA (Oracle Trace File Analyzer) não puder publicar métricas, o TFA aguardará uma hora para tentar publicar as métricas novamente. Isso é necessário para evitar a criação de um backlog do processamento de métricas no TFA.

Potencialmente, uma hora de métricas será perdida entre a restauração da rede e a primeira métrica publicada.

  1. Abra a Console do Oracle Cloud Infrastructure clicando no ícone de menu ao lado de Oracle Cloud.
  2. Na lista de navegação esquerda, clique em Observabilidade e Gerenciamento.
  3. Em Monitoramento, clique em Métricas do Serviço.
  4. Na página Métricas do Serviço, em Compartimento, selecione seu compartimento.
  5. Na página Métricas de Serviço, em Namespace de Métricas selecione oci_database_cluster.
  6. Se houver diversos clusters de VMs no compartimento, você poderá mostrar as métricas agregadas entre os clusters selecionando Streams de Métricas Agregadas .
  7. Se quiser limitar as métricas que você vê, ao lado de Dimensões, clique em Adicionar (clique em Editar se já tiver adicionado dimensões).
  8. No campo Nome da Dimensão, selecione uma dimensão.
  9. No campo Valor da Dimensão, selecione um valor.
  10. Clique em Concluído.
  11. Na caixa de diálogo Editar dimensões, clique em +Dimensão Adicional para adicionar outra dimensão. Clique no X para remover uma dimensão.
  12. Para criar um alarme em uma métrica específica, clique em Opções e selecione Criar um Alarme nesta Consulta. Consulte Gerenciando Alarmes para obter informações sobre como definir e usar alarmes.
Observação

Se você não vir métricas, verifique as definições de rede e a versão do AHF listadas na seção de pré-requisitos.

Exibir Métricas de Bancos de Dados em um Compartimento

Execute as etapas a seguir para exibir as métricas dos bancos de dados de um compartimento usando a console.

Observação

Quando houver um problema de rede e o TFA (Oracle Trace File Analyzer) não puder publicar métricas, o TFA aguardará uma hora para tentar publicar as métricas novamente. Isso é necessário para evitar a criação de um backlog do processamento de métricas no TFA.

Potencialmente, uma hora de métricas será perdida entre a restauração da rede e a primeira métrica publicada.

  1. Abra a Console do Oracle Cloud Infrastructure clicando no ícone de menu ao lado de Oracle Cloud.
  2. Na lista de navegação esquerda, clique em Observabilidade e Gerenciamento.
  3. Em Monitoramento, clique em Métricas do Serviço.
  4. Na página Métricas do Serviço, em Compartimento, selecione seu compartimento.
  5. Na página Métricas de Serviço, em Namespace de Métricas, selecione oci_database.
  6. Se houver diversos bancos de dados no compartimento, você poderá mostrar as métricas agregadas entre os bancos de dados selecionando Streams de Métricas Agregadas .
  7. Se quiser limitar as métricas que você vê, ao lado de Dimensões, clique em Adicionar (clique em Editar se já tiver adicionado dimensões).
  8. No campo Nome da Dimensão, selecione uma dimensão.
  9. No campo Valor da Dimensão, selecione um valor.
  10. Clique em Concluído.
  11. Na caixa de diálogo Editar dimensões, clique em +Dimensão Adicional para adicionar outra dimensão. Clique no X para remover uma dimensão.
  12. Para criar um alarme em uma métrica específica, clique em Opções e selecione Criar um Alarme nesta Consulta. Consulte Gerenciando Alarmes para obter informações sobre como definir e usar alarmes.

Gerenciar o Oracle Trace File Analyzer

A implantação do Autonomous Health Framework (AHF) certificado pela nuvem, que inclui o Oracle Trace File Analyzer, é gerenciada pela Oracle. Você não deve instalá-lo manualmente nas VMs convidadas.

  • Para verificar o status de execução do Oracle Trace File Analyzer, execute o comando tfactl status como root ou um usuário não raiz:
    # tfactl status 
    .-------------------------------------------------------------------------------------------------.
    | Host           | Status of TFA | PID    | Port | Version    | Build ID             | Inventory Status|
    +----------------+---------------+--------+------+------------+----------------------+------------+
    | node1          | RUNNING       |  41312 | 5000 | 22.1.0.0.0 | 22100020220310214615| COMPLETE    |
    | node2          | RUNNING       | 272300 | 5000 | 22.1.0.0.0 | 22100020220310214615| COMPLETE    |
    '----------------+---------------+--------+------+------------+----------------------+------------'
  • Para iniciar o daemon Oracle Trace File Analyzer no nó local, execute o comando tfactl start como root:
    # tfactl start
    Starting TFA..
    Waiting up to 100 seconds for TFA to be started..
    . . . . .
    . . . . .
    . . . . .
    . . . . .
    . . . . .
    . . . . .
    . . . . .
    . . . . .
    Successfully started TFA Process..
    . . . . .
    TFA Started and listening for commands
  • Para interromper o daemon Oracle Trace File Analyzer no nó local, execute o comando tfactl stop como root:
    # tfactl stop
    Stopping TFA from the Command Line
    Nothing to do !
    Please wait while TFA stops
    Please wait while TFA stops
    TFA-00002 Oracle Trace File Analyzer (TFA) is not running
    TFA Stopped Successfully
    Successfully stopped TFA..

Gerenciar o Database Service Agent

Veja o arquivo /opt/oracle/dcs/log/dcs-agent.log para identificar problemas com o agente.

  • Para verificar o status do Database Service Agent, execute o comando systemctl status:
    # systemctl status dbcsagent.service
    dbcsagent.service
    Loaded: loaded (/usr/lib/systemd/system/dbcsagent.service; enabled; vendor preset: disabled)
    Active: active (running) since Fri 2022-04-0113:40:19UTC; 6min ago
    Process: 9603ExecStopPost=/bin/bash -c kill `ps -fu opc |grep "java.*dbcs-agent.*jar"|awk '{print $2}'` (code=exited, status=0/SUCCESS)
    Main PID: 10055(sudo)
    CGroup: /system.slice/dbcsagent.service
    ‣ 10055sudo -u opc /bin/bash -c umask 077; /bin/java
  • Para iniciar o agente se ele não estiver em execução, execute o comando systemctl start como usuário root:
    systemctl start dbcsagent.service