Monitoramento e Observabilidade
A nuvem revolucionou a maneira como as empresas consomem tecnologia. No passado, as empresas assumiam a propriedade e a responsabilidade por todos os níveis de tecnologia, da infraestrutura ao software. Agora, a nuvem oferece o potencial para que as empresas provisionem e consumam recursos conforme a necessidade. Embora o benefício seja maior eficiência e produtividade, a nuvem introduz alterações adicionais nos modelos operacionais. As alterações incluem:
- O modelo de responsabilidade compartilhada entre a empresa e os provedores de nuvem
- A necessidade da empresa de manter aplicativos on-premises e em várias nuvens
- Requisitos da equipe de TI para integrar os conjuntos de ferramentas existentes com novas ferramentas de plataforma de nuvem
O OCI (Oracle Cloud Infrastructure) usa os melhores processos operacionais da categoria para proteger e monitorar a infraestrutura de nuvem subjacente, como instalações de data center, hardware e sistemas de software. O OCI fornece ferramentas que permitem executar com segurança suas cargas de trabalho e monitorar seus recursos de nuvem, como computação, rede, armazenamento, banco de dados e os aplicativos de ponta a ponta.
O que é Monitoramento e Observabilidade?
Monitoramento é uma ferramenta ou um serviço que acompanha o estado de um sistema e aciona uma notificação quando uma condição predefinida é atendida.
Observabilidade é uma ferramenta ou uma solução que usa dados de telemetria de um sistema, como métricas, logs e rastreamentos, para depurar um problema e melhorar o desempenho.
Como Monitorar Serviços do OCI
O OCI oferece conjuntos predefinidos de métricas, logs e eventos para fornecer visibilidade de infraestrutura interna e serviços. O OCI também fornece integrações com Grafana, PagerDuty e Slack, além de oferecer suporte a padrões da CNCF (Cloud Native Computing Foundation), como CloudEvents e OpenTracing.
Métricas: Você pode ter uma visão abrangente das métricas emitidas pelos serviços do OCI usando o Metrics Explorer na Console. Para obter mais informações sobre o OCI Monitoring e uma lista de serviços que emitem métricas, consulte Visão Geral do Serviço Monitoring.
O serviço Monitoring permite definir limites em métricas de recursos para gerar alarmes. Os alarmes podem alimentar o serviço OCI Notifications. Você também pode acessar métricas de integração com ferramentas de terceiros que não dependem de fornecedores de nuvem, como o Grafana, que é uma plataforma de código-fonte aberto para monitoramento e análise.
Logs: O OCI Logging fornece acesso a logs de recursos do OCI. Os logs incluem informações críticas de diagnóstico que descrevem o desempenho dos recursos e como eles estão sendo acessados. Para obter mais informações, consulte Visão Geral do Serviço Logging.
Eventos: Os serviços do OCI emitem eventos. Eventos são mensagens estruturadas que indicam uma alteração de estado nos recursos do OCI. Os exemplos de eventos incluem:
- Criar uma instância
- Excluir uma Instância
- Criar, atualizar ou excluir um recurso
Os eventos podem ser roteados pelo serviço Notifications para canais apropriados. Os eventos também podem alimentar o OCI Functions para itens acionáveis, como notificar uma equipe específica sobre o lançamento de uma instância. Para obter mais informações sobre serviços que emitem eventos, consulte Serviços que Produzem Eventos.
Plataforma de Observabilidade e Gerenciamento
Os serviços de observabilidade e gerenciamento do OCI são projetados para atender aos desafios de soluções e aplicativos modernos que consistem em muitos componentes que usam diferentes tecnologias. Esse conjunto de serviços fornece visibilidade e informações sobre tecnologia nativa da nuvem e tradicional, provedores de nuvem e ambientes on-premises, além de amplo suporte a ecossistema baseado em padrões. A plataforma é projetada para ajudar você a gerenciar portfólios de TI cada vez mais diversificados e distribuídos, reduzindo o tempo de solução de problemas, evitando interrupções e permitindo que a TI gerencie aplicativos de uma perspectiva de negócios. Os serviços incluem métricas, eventos, logs e muito mais, fornecendo flexibilidade, dependendo de sua necessidade de personalização. Os serviços e os recursos incluem:
Monitoramento: Permite que serviços e clientes do OCI emitam métricas sobre recursos de clientes do OCI. Os recursos de monitoramento incluem métricas de serviço, Metrics Explorer e status e definição de alarme. Você pode configurar alarmes com limites para detectar e responder a anomalias de infraestrutura e aplicativo.
Verificações de Integridade: Fornece monitoramento externo de alta frequência para determinar a disponibilidade e o desempenho de qualquer serviço público, incluindo sites hospedados, pontos finais de API ou balanceadores de carga externos.
APM (Application Performance Monitoring): Fornece uma visibilidade ampla do desempenho de aplicativos e permite que profissionais de DevOps diagnostiquem problemas rapidamente. O APM é compatível com OpenTracing e OpenMetrics para rastreamento distribuído e combina o monitoramento do usuário final com o monitoramento sintético. Ele também pode ingerir telemetria de microsserviços implantados em contêineres Kubernetes ou Docker.
Database Management: Fornece desempenho e capacidade de gerenciamento abrangentes do banco de dados para cada tipo de Oracle Database, incluindo OCI e on-premises. Esse recurso reduz significativamente a carga sobre os administradores de banco de dados, fornecendo uma solução de ciclo de vida completo que abrange monitoramento, gerenciamento de desempenho, ajuste e administração de banco de dados.
Java Management Service: Pode descobrir, monitorar e gerenciar seu ambiente Java. Depois de implantado, o serviço descobre quais versões do Java você tem em execução e onde, quais exigem atualizações e quais aplicativos as estão usando. Esse serviço está incluído na sua Assinatura do Java SE.
Logging: Fornece fácil ingestão de dados de log e análise para diagnosticar problemas. Você pode integrar o Logging com serviços do OCI, como Streaming, Monitoring, OCI Functions e Notifications. O Logging usa o padrão CloudEvents pela CNCF e usa o CNCF Fluentd para ingerir logs de centenas de fontes.
Logging Analytics: Solução de nuvem baseada em aprendizado de máquina que monitora, agrega, indexa e analisa todos os dados de log de seus ambientes on-premises e multinuvem.
Notifications: Serviço de publicação e assinatura altamente disponível e de baixa latência que envia alertas e mensagens ao OCI Functions, parceiros de entrega de e-mail e mensagem, incluindo o Slack e o PagerDuty.
Operation Insights: Ferramenta de planejamento de capacidade que permite aos administradores descobrir problemas de desempenho, prever o consumo e planejar a capacidade usando análise baseada em aprendizado de máquina em dados históricos e SQL. Use esses recursos para tomar decisões orientadas por dados a fim de otimizar o uso de recursos, evitar interrupções de forma proativa e melhorar o desempenho.
Resource Manager: Ferramenta de automação de infraestrutura de nuvem baseada no Terraform que oferece recurso de serviço de infraestrutura como código.
Service Connector Hub: Ajuda os engenheiros de nuvem a gerenciar e mover dados entre os serviços do OCI e do OCI para serviços de terceiros.
Monitoramento de Pilha: Permite o monitoramento proativo de aplicativos e sua pilha subjacente, incluindo servidores de aplicativos e bancos de dados.
Enterprise Manager: Fornece monitoramento e gerenciamento abrangentes para Oracle Applications, Middleware, Database e Engineered Systems implantados em nuvens híbridas.
Governança: Fornece uma ampla gama de serviços para ajudar a otimizar custos, maximizar a utilização e garantir a adesão aos padrões corporativos e à conformidade legislativa dos ativos implantados no OCI.