Observação:

Gerenciar a utilização do disco de VM usando o Monitoramento de Pilha

Introdução

Uma das principais responsabilidades de um administrador de nuvem é gerenciar e monitorar os recursos implantados nos ambientes da organização. Para todos os tipos de cargas de trabalho, é necessário monitorar a integridade dos recursos e as alterações periodicamente e garantir que todas as cargas de trabalho estejam com status verde - íntegro e em execução.

Em instâncias de computação, o armazenamento desempenha um papel vital em termos de estabilidade de aplicativos, execução e armazenamento de dados do aplicativo, usuários em arquivos de banco de dados etc. É importante que um administrador monitore e gerencie o armazenamento de cada volume ou disco anexado à instância de computação para mitigar a falha do aplicativo, o tempo de inatividade e a perda de dados dos usuários e das organizações.

O Monitoramento de Pilha é um dos serviços oferecidos para monitorar instâncias de computação no OCI (Oracle Cloud Infrastructure) sob a Observabilidade e o Gerenciamento para a infraestrutura implantada na tenancy do OCI. O Monitoramento de Pilha permite não apenas o armazenamento de cada disco, mas também os sistemas de arquivos criados em cada volume anexado às instâncias de computação. Além do armazenamento, o monitoramento de pilha fornece métricas para Disponibilidade, CPU, Memória e atividade de Disco + Paginação das instâncias de computação.

Recursos do Serviço Stack Monitoring

O Monitoramento de Pilha fornece as ferramentas para alertar e identificar rapidamente problemas como um sistema de arquivos que está ficando sem espaço em disco ou alta utilização de CPU. O Monitoramento de Pilha fornece maior visibilidade da integridade e do status de disponibilidade das instâncias de computação. Ele também fornece um painel de controle de exibição compilado de todos os recursos que estão sendo monitorados. Com o Monitoramento de Pilha, você pode:

Objetivo

Saiba como gerenciar a utilização de discos de VM usando o Monitoramento de Pilha.

Pré-requisitos

  1. Crie ou designe um compartimento a ser usado:

    Você pode criar um novo compartimento ou usar um existente para instalar e configurar o serviço Stack Monitoring. Para obter informações sobre compartimentos, consulte Gerenciando Compartimentos.

    Ao designar um compartimento de monitoramento, certifique-se de usar o mesmo compartimento para seus agentes e recursos nativos do OCI (por exemplo, Bancos de Dados, Instâncias de Computação). Se os recursos estiverem em compartimentos diferentes, mova os recursos para o mesmo compartimento dos agentes de monitoramento da pilha.

  2. Criar um Grupo Dinâmico de todos os Management Agents:

    Para interagir com os pontos finais de serviços do OCI, crie explicitamente um grupo dinâmico para permitir que os Management Agents se comuniquem com o serviço Management Agent (MACS). Para criar um grupo dinâmico, siga as etapas:

    1. Em Identidade e Segurança, vá para Identidade e clique em Grupos Dinâmicos.

    2. Clique em Criar Grupo Dinâmico.

    3. Na caixa de diálogo Criar Grupo Dinâmico, informe um nome para o grupo dinâmico, uma descrição e as regras de correspondência e, em seguida, clique em Criar Grupo Dinâmico.

      Grupo dinâmico

      Por exemplo, você cria um grupo dinâmico chamado "Demo_DyanmicGroup_For_MonitoringAgent" com os seguintes detalhes em RULE 1:

      ALL {resource.type='managementagent', resource.compartment.id='ocid1.compartment.oc1.examplecompartmentid'}

  3. Crie uma política no Grupo Dinâmico:

    Você precisa criar as seguintes políticas para permitir que os Management Agents interajam com o serviço Management Agent e permitir que os Management Agents façam upload dos dados.

    • Política 1: ALLOW DYNAMIC-GROUP <Demo_DynamicGroup_For_MonitoringAgent >TO USE METRICS IN COMPARTMENT <compartment_name> where target.metrics.namespace = 'oracle_appmgmt'

      Descrição: Permita que o agente faça upload de métricas para a Telemetria no namespace 'oracle_appmgmt'. Aqui, o Management_Agent_Dynamic_Group é um grupo dinâmico de agentes de gerenciamento em um compartimento.

    • Política 2: ALLOW DYNAMIC-GROUP <Demo_DynamicGroup_For_MonitoringAgent> TO {STACK_MONITORING_DISCOVERY_JOB_RESULT_SUBMIT} IN COMPARTMENT <compartment_name>`

      Descrição: Permitir que o agente faça upload de dados para o serviço de descoberta. Aqui, o Management_Agent_Dynamic_Group é um grupo dinâmico de agentes de gerenciamento em um compartimento.

    Observação: Você poderá ignorar os Pré-requisitos 4 e os Pré-requisitos 5 se tiver privilégios de administrador na tenancy. As etapas a seguir deverão ser seguidas se o administrador quiser criar usuários para gerenciar apenas o monitoramento da pilha especificamente.

  4. Crie usuários e grupos:

    Como prática recomendada, crie usuários e grupos separados para gerenciar as operações relacionadas ao monitoramento de pilha. No entanto, o grupo de administradores e seus usuários terão os privilégios necessários por padrão. Os usuários e grupos do Monitoramento de Pilha são criados usando o serviço Identity and Access Management (IAM) do Oracle Cloud Infrastructure. Para obter informações sobre como criar e gerenciar usuários e grupos usando o serviço Identity and Access Management (IAM), consulte Gerenciando Usuários e Gerenciando Grupos. Crie os seguintes grupos de usuários necessários ao Monitoramento de Pilha.

    Grupo Descrição
    StackMonitoringAdminGrp Grupo para Usuários que executam operações relacionadas ao administrador/operador.
  5. Crie as políticas necessárias:

    As políticas de Monitoramento de Pilha são criadas usando as políticas de IAM (Identity and Access Management). Este tutorial fornece exemplos específicos para configurar sua tenancy para utilizar o Monitoramento de Pilha. Para obter informações gerais sobre políticas do OCI, consulte Introdução a Políticas.

    Criar Políticas para Operações Administrativas

    Veja a seguir a lista de políticas a serem definidas para permitir que os usuários que podem executar operações de administração, isto é, os usuários que pertencem ao grupo StackMonitoringAdminGrp.

    • Política 1: ALLOW GROUP StackMonitoringAdminGrp TO MANAGE stack-monitoring-family IN COMPARTMENT <compartment_name>

      Descrição: Permita que os usuários do grupo StackMonitoringAdminGrp executem operações administrativas em um compartimento.

    • Política 2: ALLOW GROUP StackMonitoringAdminGrp TO {MGMT_AGENT_DEPLOY_PLUGIN_CREATE, MGMT_AGENT_INSPECT, MGMT_AGENT_READ} IN COMPARTMENT <compartment_name>

      Descrição: Permita que os usuários do grupo StackMonitoringAdminGrp listem/ leiam agentes e implantem o plug-in Stack Monitoring Management Agent durante a descoberta de recursos quando o Management Agent não tiver o plug-in ainda no escopo do compartimento.

    • Política 3: ALLOW GROUP StackMonitoringAdminGrp TO READ metrics IN COMPARTMENT <compartment_name>

      Descrição: Permita que os usuários do grupo StackMonitoringAdminGrp leiam métricas em um compartimento.

    • Política 4: ALLOW GROUP StackMonitoringAdminGrp to READ instances IN COMPARTMENT<compartment_name>

      Descrição: Permita que os usuários do grupo StackMonitoringAdminGrp leiam instâncias em um compartimento.

    • Política 5: ALLOW GROUP StackMonitoringAdminGrp to MANAGE external-database-family IN COMPARTMENT <compartment_name>

      Descrição: Permita que os usuários do grupo StackMonitoringAdminGrp gerenciem bancos de dados externos em um compartimento.

    • Política 6: ALLOW GROUP StackMonitoringAdminGrp to MANAGE alarms IN COMPARTMENT<compartment_name>

      Descrição: Permita que os usuários do grupo StackMonitoringAdminGrp gerenciem alarmes em um compartimento.

    • Política 7: ALLOW GROUP StackMonitoringAdminGrp to USE ons-topics IN COMPARTMENT <compartment_name>

      Descrição: Permita que os usuários no StackMonitoringAdminGrp listem, criem, atualizem, excluam e movam inscrições para tópicos na tenancy.

Tarefa 1: Instalar Management Agents

Você deve instalar o plug-in do Management Agent, pois ele é necessário para usar o serviço Stack Monitoring.

  1. Faça log-in na Console do Oracle Cloud, no menu de navegação, clique em Compute e, em seguida, clique em Instâncias.

  2. Clique na instância desejada.

  3. Clique na guia Oracle Cloud Agent. A lista de plug-ins é exibida.

  4. Alterne a chave Ativado para o plug-in do serviço Management Agent.

    Oracle Agents

Depois que o agente for ativado, levará cerca de 10 a 15 minutos para ser alterado para o status em execução.

Tarefa 2: Verificar o ID do Agente de Monitoramento

  1. Faça log-in na Console do Oracle Cloud, no menu de navegação, clique em Observação e Gerenciamento.

  2. Selecione Management Agent Service.

  3. Selecione o compartimento na lista drop-down Compartimento e você verá a lista de agentes que estão ativados para suas respectivas instâncias de computação.

    Agentes e Gateways

  4. Selecione o agente para a instância de computação associada à qual você deseja ativar o monitoramento da pilha e anote o "ID do Agente" de monitoramento para uso futuro.

    Visão Geral do Agente

Tarefa 3: Executar o job Descoberta do Stack Monitoring

A etapa final é executar o job de descoberta promovendo Instâncias do OCI Compute. Você pode monitorar uma instância de computação de forma mais completa e obter insights dos recursos que ela está sendo usada. Para essa etapa, você precisa abrir um shell de nuvem no portal do OCI.

  1. Clique no OCI Cloud Shell na home page e a janela a seguir é exibida. Além disso, você também pode executar a etapa em um dispositivo com a CLI do OCI Instalada.

    Serviço Cloud Shell

  2. Verifique a versão da CLI do OCI usando o comando oci –version. Os comandos do Monitoramento de Pilha serão executados no OCI CLI 3.XX ou superior.

  3. Crie um arquivo JSON chamado parameters.json no shell da nuvem em qualquer diretório. Copie o JSON fornecido abaixo e substitua "", "", "" por seus respectivos parâmetros. Os detalhes dos parâmetros a serem alterados são fornecidos na tabela "Parâmetros de Entrada JSON":

    {
        "discoveryType": "ADD",
        "discoveryClient": "host-discovery",
        "compartmentId": "<Compartment-ID>",
        "discoveryDetails": {
          "agentId": "<Agent-ID>",
          "resourceType": "HOST",
          "resourceName": "<HostName or IP Address>",
          "properties": {
            "propertiesMap": {}
          }
        }
    }
    

    Parâmetros de Entrada JSON

    Campo de Entrada Descrição
    compartmentId OCID do compartimento onde a instância de computação reside.
    agentId O OCID do agente de gerenciamento que está monitorando o recurso.
    resourceName O nome de domínio totalmente qualificado (FQDN) do host no Monitoramento de Pilha.
  4. Depois de salvar o arquivo JSON acima, execute o comando a seguir substituindo o parâmetro <path_to_JSON_file> pelo caminho real do arquivo JSON que foi criado na etapa anterior. Você pode usar o comando pwd para obter o caminho do arquivo JSON.

    oci stack-monitoring discovery-job create --compartment-id "your-compartment-id" --from-json file://< path_to_JSON_file>

    Job de Descoberta"

  5. O processo pode levar de 5 a 10 minutos para ser concluído e, depois de atualizar o portal do OCI, você poderá ver o Monitoramento de Pilha ativado e um painel de controle completo na página Monitoramento de Pilha. Após a promoção, o tipo de recurso da instância de computação é um Host.

    Painel de Controle do Serviço Stack Monitoring

  6. Verifique o status do Job de Promoção em Descoberta de Recursos para verificar o sucesso da descoberta dos recursos.

    Lista de agentes SM

  7. No Painel de Controle de Monitoramento de Pilha, selecione o bloco de Recursos e você receberá uma lista de instâncias e hosts de computação para os quais ativou o monitoramento.

    Lista SM 2

  8. Selecione o host desejado na lista e você verá a view detalhada das métricas e tabelas exibidas para esse host específico.

    Visão Geral do SM Agent

    As informações e métricas do host são exibidas como gráficos e tabelas na página de detalhes do recurso.

    Gráfico da Página Principal 1

    Gráfico da Página Principal 2

    Gráfico da Página Principal 3

    Você pode escolher o Sistema de Arquivos Usado (GBs) e a Utilização do Sistema de Arquivos(%) para obter informações mais específicas sobre o armazenamento presente no host. A exibição de tabela fornece todas as métricas em um estilo/formato de tabela.

    Tabela da Página Principal

    Depois que você selecionar as informações específicas das instâncias, elas serão exibidas em porcentagem e armazenamento em GB. Cada sistema de arquivos apresentado na máquina host será representado com os pontos de montagem no formato de tabela.

    Tabela de Discos Infor

Tarefa 4: Ativar Alarmes

  1. Depois que as métricas forem exibidas na página Detalhes dos Recursos dos hosts, para obter um alerta para métricas específicas, navegue até Observabilidade e Gerenciamento, Monitoramento, Status do Alarme.

  2. Clique em Criar Alarme e digite o nome e a severidade do alarme. Selecione o compartimento do host, namespace "oracle appmgmt, host do grupo de recursos, e você pode selecionar o nome da métrica na lista drop-down.

  3. Com base no requisito, escolha a métrica Sistema de Arquivos Usado ou Utilização do Sistema de Arquivos, o período de intervalo e a estatística.

  4. Depois de escolher as métricas, escolha a dimensão da métrica.

    • Para especificar um host específico, escolha "agentHostName" e escolha o valor da dimensão para o host no menu drop-down.

    • Em seguida, clique em Dimensão adicional, escolha "fileSystemName" e, em seguida, escolha na lista o valor da dimensão do ponto de montagem cujo alerta você deseja acionar.

  5. Na regra de acionamento da seção, defina a condição para colocar o alarme no estado de acionamento. Por exemplo, para agentHostName - "XXXX" e "fileSystemName" - "/Dev" com estatísticas - "mean". Se o armazenamento do sistema de arquivos atingir mais de 90%, acione um alerta para "armazenamento cheio".

  6. Selecione o serviço de Destino - Notificação e o Tópico no qual você especificou o endereço de E-mail que deseja receber alertas para esse alarme específico na seção Definir notificações de alarme. Para obter mais informações sobre Notificação e criação do Tópico, clique aqui.

  7. Além disso, você também pode escolher o Formato de Mensagem para obter melhor formatação de alerta. Marque a caixa de seleção Repetir notificação se quiser receber alertas contínuos para as mesmas métricas.

  8. Salve o alarme.

    Alarme 1

    Alarme 2

    Alarme 3

  9. Depois que a regra definida corresponder à métrica, o alarme será acionado e Abaixo está a captura de tela de exemplo de um alarme de métrica:

    Alarme 5

    Você pode utilizar as métricas avançadas fornecidas pelos recursos OCI Stack Monitoring and Alarms para monitorar sua infraestrutura de computação, particularmente no setor de armazenamento. Você também pode explorar mais recursos de monitoramento de pilha para diferentes serviços.

Agradecimentos

Mais Recursos de Aprendizagem

Explore outros laboratórios no site docs.oracle.com/learn ou acesse mais conteúdo de aprendizado gratuito no canal YouTube do Oracle Learning. Além disso, visite education.oracle.com/learning-explorer para se tornar um Oracle Learning Explorer.

Para obter a documentação do produto, visite o Oracle Help Center.