Monitore sua Carga de Trabalho

Entenda e adote um processo de monitoramento para todos os serviços do Oracle Cloud Infrastructure. O serviço Monitoring usa métricas para monitorar recursos e alarmes para notificá-lo quando as métricas atenderem aos acionadores especificados pelo alarme.

Analisar Métricas da Operação

Arquiteto de Rede, Gerente de Operações em Nuvem, Arquiteto de Segurança

Defina, capture e analise métricas de operação para obter visibilidade dos eventos.

O serviço Oracle Cloud Infrastructure Monitoring oferece a visão necessária à compreensão sobre a integridade dos recursos, otimização do desempenho de aplicativos e resposta às anomalias em tempo real. Você pode definir alarmes para alertá-lo em tempo real sobre alterações importantes em sua infraestrutura e serviços de nuvem, permitindo que você execute rapidamente as ações apropriadas.

Definir Verificações de Integridade

Arquiteto de Nuvem, Gerente de Operações em Nuvem, Arquiteto de Segurança

O serviço Oracle Cloud Infrastructure Health Checks fornece aos usuários monitoramento externo de alta frequência para determinar a disponibilidade e o desempenho de qualquer serviço público, incluindo sites hospedados, pontos finais de API ou balanceadores de carga externos.

Use o Oracle Cloud Infrastructure Health Checks para garantir que você esteja imediatamente ciente de qualquer problema de disponibilidade que afete seus clientes.

Monitorar Serviços de Computação

Gerente de Operações na Nuvem, Arquiteto de Segurança

Certifique-se de que sua equipe de operações use e aplique métricas de serviços de computação.

Use métricas, alarmes e notificações para monitorar o seguinte:

  • Instância de Computação: Monitore a integridade, a capacidade e o desempenho de suas instâncias de computação.
  • Integridade da Infraestrutura: Monitore a integridade, a capacidade e o desempenho de suas instâncias bare metal de computação
  • Oracle Cloud Infrastructure Functions: Monitore a integridade, a capacidade e o desempenho das funções que você implantou no Oracle Cloud Infrastructure Functions.
  • Integridade do Banco de Dados: Monitore a integridade, a capacidade e o desempenho dos seus serviços de banco de dados. O Oracle Cloud Observability and Management Platform fornece recursos unificados de monitoramento e administração de banco de dados para bancos de dados em nuvem.
  • Integridade do Sistema Operacional: Implemente ferramentas de log no nível do SO, como auditd.

Monitore suas redes

Arquiteto de Rede, Gerente de Operações em Nuvem, Arquiteto de Segurança

Adote um mecanismo em que as métricas sejam aplicadas em diferentes pontos finais de rede. Você pode ter métricas para rede virtual na nuvem (VCN) interna e também para conectividade (Oracle Cloud Infrastructure FastConnect e IPsec VPN) ou balanceador de carga.

Use métricas, alarmes e notificações para monitorar o seguinte:

  • Métricas de VNIC: Monitore a integridade, a capacidade e o desempenho de suas VNICs do serviço Networking (placas de interface de rede virtual).
  • FastConnect Métricas: Monitore a integridade, a capacidade e o desempenho da conexão entre sua rede local e a VCN (conexão do Oracle Cloud Infrastructure FastConnect).
  • Métricas do VPN Connect: Monitore a integridade, a capacidade e o desempenho da conexão entre sua rede local e a VCN (também conhecida como IPSec VPN).
  • Métricas do Gateway de Serviço: Monitore a integridade, a capacidade e o desempenho de seus gateways de serviço, que permitem que hosts locais ou hosts da VCN acessem de forma privada serviços Oracle (como Object Storage e Autonomous Database) sem expor os recursos à internet pública.
  • Métricas de Balanceamento de Carga: Monitore a integridade, a capacidade e o desempenho de seus balanceadores de carga, que atuam como intermediários para o tráfego de dados entre clientes e servidores de aplicativos.
  • Customer Premises Equipment: Monitore a integridade, a capacidade e o desempenho do equipamento de borda em sua rede que se conecta ao OCI (Oracle Cloud Infrastructure).
  • Ative logs de Fluxo da VCN e ingira-os com o Oracle Cloud Logging Analytics para analisá-los e identificar padrões interessantes e obter insights, conforme necessário.

Use o OCI Network Command Center e as ferramentas disponíveis para monitorar e observar sua rede. O OCI Network Command Center oferece as seguintes ferramentas de observabilidade para suportar vários casos de uso de operações:

  • Visualizador de Rede

    Oferece visualização intuitiva de topologia para entender conexões e relacionamentos entre seus recursos de rede virtual, inspecionar a configuração em um só lugar e solucionar problemas de configuração visualmente.

  • Analisador de Caminho de Rede

    Permite solucionar problemas de configurações de rede virtual complexas quando você tem problemas de acessibilidade. Fornece análise de configuração automatizada para determinar o caminho de rede utilizado pelo tráfego, identificar problemas de configuração de roteamento e segurança e fornecer informações de configuração ao longo do caminho.

  • Latência entre Regiões

    Fornece informações de latência histórica e em tempo real entre as regiões da OCI.

  • Logs de Fluxo da VCN

    Oferece telemetria de tráfego de rede, essencial para dar suporte a casos de uso de segurança e operações de rede. Você pode obter insights abrangentes sobre o tráfego de rede, transmitir os logs de fluxo para a ferramenta escolhida usando protocolos padrão, como o Kafka, e arquivar os logs de fluxo no OCI Object Storage para fins de conformidade. Os logs de fluxo da VCN podem ser enviados para o Oracle Cloud Infrastructure Logging Analytics, o OCI Object Storage ou para um sistema de terceiros.

  • Ponto de Acesso de Teste Virtual (VTAP)

    Oferece recursos de espelhamento de tráfego que permitem a captura completa de pacotes para análise de segurança, solução de problemas de aplicativos ou problemas de desempenho de rede. O VTAP também é útil para solucionar problemas complexos de rede, analisando o conteúdo e os cabeçalhos do pacote.

Dados do Monitor

Arquiteto de Nuvem, Gerente de Operações em Nuvem, Arquiteto de Segurança

Monitore serviços de armazenamento que você usa para armazenar dados usando métricas, alarmes e notificações.
  • Métricas de Volume em Blocos: Monitore o throughput e as operações de Volumes em Blocos e de Inicialização.
  • Métricas do Serviço Object Storage: Monitore o tamanho e o número de objetos dos buckets do serviço Object Storage.
  • Métricas do Sistema de Arquivos: Monitore a integridade, o throughput, as solicitações e a latência dos seus sistemas de arquivos e pontos de acesso NFS.

Criar um Conjunto de Alarmes para Cada Métrica

DevOps Arquiteto, Gerente de Operações em Nuvem, Arquiteto de Segurança

Crie um conjunto de alarmes para suas métricas de serviço relevantes. Para cada métrica emitida pelos seus recursos, crie alarmes que definam os comportamentos do recurso.
  • Em risco. O recurso corre o risco de se tornar inoperante, conforme indicado pelos valores da métrica.
  • Não ideal. O recurso está sendo executado em níveis não ideais, conforme indicado pelos valores da métrica.
  • O recurso está ativo ou inativo. O recurso não está acessível ou não está em operação.

Ajustar Seus Alarmes

DevOps Arquiteto, Gerente de Operações em Nuvem, Arquiteto de Segurança

Revise seus alarmes regularmente, como semanalmente, para garantir a configuração ideal. Calibre os detalhes de limite, gravidade e notificação de cada alarme, incluindo método, frequência e público-alvo.
Os limites métricos muito amplos alertarão desnecessariamente, enquanto os limites muito apertados reduzirão o tempo para tomar ações corretivas antes de uma interrupção.

Uma configuração de alarme ideal aborda os seguintes fatores:

  • A importância do recurso.
  • O comportamento apropriado de recursos. Avalie o comportamento individualmente e dentro do contexto do ecossistema de serviço. Analise as flutuações do valor da métrica para um determinado período e, em seguida, ajuste os limites conforme necessário.
  • O ruído de notificação aceitável. Avalie o método de notificação (por exemplo, e-mail ou PagerDuty), os destinatários apropriados e a frequência de notificações repetidas.

Ativar Log do Serviço

DevOps Arquiteto, Gerente de Operações em Nuvem, Arquiteto de Segurança

Os logs de serviço são aqueles emitidos pelos serviços do Oracle Cloud Infrastructure (OCI), como os Logs de Fluxo dos serviços API Gateway, Events, Functions, Load Balancing, Object Storage e VCN. Cada um desses serviços suportados tem um recurso de Logs que permite ativar ou desativar o registro em log desse serviço.

Ative o registro em log do serviço somente se forem necessárias informações críticas de diagnóstico que descrevam como os recursos estão sendo executados e acessados.

Considere a ingestão de logs de serviço com o Oracle Cloud Infrastructure Logging Analytics para obter melhor insight e análise detalhada de padrões e tendências, conforme necessário.

Crie e mantenha políticas de retenção de log.

Ativar o Oracle Cloud Infrastructure Ops Insights

Gerente de Operações na Nuvem, Arquiteto de Segurança

O Oracle Cloud Infrastructure Ops Insights é um serviço nativo do OCI que fornece uma visão holística da utilização e capacidade de recursos do banco de dados e do host.

O Oracle Cloud Infrastructure Ops Insights consiste nos seguintes aplicativos integrados:

  • Capacity Planning
  • Oracle SQL Warehouse

Ativar Oracle Cloud Guard

DevOps Arquiteto, Gerente de Operações em Nuvem, Arquiteto de Segurança

O Oracle Cloud Guard é um serviço que ajuda os clientes a monitorar, identificar, obter e manter uma forte postura de segurança no Oracle Cloud. Use o serviço para examinar seus recursos do Oracle Cloud Infrastructure quanto a falhas de segurança relacionadas à configuração e seus operadores e usuários quanto a atividades de risco.

Certifique-se de que o Oracle Cloud Guard esteja ativado no nível raiz da sua tenancy para monitorar todos os seus compartimentos.

Configurar Auditoria

DevOps Arquiteto, Gerente de Operações em Nuvem, Arquiteto de Segurança

O serviço Oracle Cloud Infrastructure Audit registra automaticamente as chamadas para todos os pontos finais suportados da Interface de Programação de Aplicativos (API) públicos do Oracle Cloud Infrastructure (OCI) como eventos de log. Atualmente, todos os serviços suportam logs do Audit.

Revise o seguinte ao configurar a auditoria:

  • Revise a duração da retenção de auditoria. O padrão é definido como 365 dias.
  • Se você tiver ferramentas de terceiros que devem acessar os dados do OCI Audit, configure um Conector de Serviço para copiar os dados do OCI Audit para o Oracle Cloud Infrastructure Object Storage.
  • Certifique-se de que o período de retenção no bucket de armazenamento esteja configurado adequadamente.
  • Considere a ingestão de um subconjunto de logs de auditoria com o OCI Log Analytics para obter melhor insight e análise detalhada de padrões e tendências, conforme necessário.