Observabilidade e Gerenciamento na Nuvem

Use os serviços de Observabilidade e Gerenciamento do Oracle Cloud Infrastructure (OCI) para obter visibilidade e insights acionáveis que ajudam você a gerenciar seu ambiente de nuvem.

Os serviços do OCI relacionados à observabilidade e ao gerenciamento permitem monitorar, auditar e alertar para alterações no seu ambiente de nuvem. Insights orientados por machine learning ajudam a gerenciar recursos implantados em uma variedade de tecnologia entre todas as camadas da pilha.

Uma das principais prioridades é aumentar a automação que permite resultados escaláveis e previsíveis. Use a funcionalidade integrada e a automação para o gerenciamento de operações de TI e monitoramento DevOps para evitar e resolver problemas de TI.

Os serviços de Observabilidade e Gerenciamento no OCI incluem os seguintes serviços:

Application Performance Monitoring
O serviço Application Performance Monitoring fornece visibilidade profunda do desempenho dos aplicativos e permite diagnósticos rápidos para fornecer um nível consistente de serviço. Isso inclui monitoramento de vários componentes e lógica do aplicativo espalhados pelos clientes, serviços de terceiros e camadas de computação de back-end, no local ou na nuvem. Para obter uma visão geral, consulte a página do produto Application Performance Monitoring.
Management Agent
O Management Agent é um serviço que fornece comunicação interativa de baixa latência e coleta de dados entre a OCI e outros destinos.
Database Management
O serviço Database Management oferece recursos abrangentes de gerenciamento e diagnóstico de desempenho do banco de dados para monitorar e gerenciar bancos de dados Oracle. Para obter uma visão geral, consulte a página do produto Database Management.
Logging
O Logging permite que você ative, exiba e gerencie todos os logs em sua tenancy e fornece acesso aos logs dos recursos do OCI. Esses logs incluem informações críticas de diagnóstico que descrevem o desempenho e o acesso dos recursos. Para obter uma visão geral, consulte a página do produto Logging.
Log Analytics
O Log Analytics é uma solução unificada na nuvem integrada que permite monitorar, agregar, indexar, analisar, pesquisar, explorar e correlacionar todos os dados de log de suas aplicações e da infraestrutura de sistema. Para obter uma visão geral, consulte a página de produto do Log Analytics.
Java Management
Java Management é uma infraestrutura de relatórios e gerenciamento na OCI. Ele permite observar e gerenciar o uso do Java na sua empresa.
Monitoring
Use o serviço Monitoring para consultar métricas e gerenciar alarmes. Métricas e alarmes ajudam a monitorar a integridade, a capacidade e o desempenho dos seus recursos de nuvem.
Ops Insights
O Ops Insights fornece informações abrangentes sobre o uso e a capacidade de recursos de bancos de dados e hosts. Use este serviço para analisar recursos de CPU e armazenamento, prever e planejar a capacidade e identificar proativamente problemas de desempenho de SQL em uma frota de bancos de dados. Para obter uma visão geral, consulte a página de produto do Ops Insights.
Service Connector Hub
O Service Connector Hub é uma plataforma de barramento de mensagens em nuvem que oferece um único painel de vidro para descrever, executar e monitorar interações ao começar a mover dados entre serviços do OCI. Para obter uma visão geral, consulte a página do produto Service Connector Hub.
Stack Monitoring

O serviço Stack Monitoring permite o monitoramento proativo de aplicativos e sua pilha subjacente, incluindo servidores de aplicativos e bancos de dados. Ao descobrir todos os componentes de um aplicativo, incluindo a topologia do aplicativo, o Stack Monitoring coleta automaticamente métricas de status, carga, resposta, erro e utilização para todos os componentes do aplicativo. Cada componente da pilha de aplicativos é chamado de recurso.

Para obter uma visão geral, consulte a página do produto Stack Monitoring.

Para obter visibilidade abrangente do seu ambiente de nuvem recém-implantado, use os serviços de Observabilidade e Gerenciamento que atendem às necessidades da sua organização.

Monitoring

Use métricas e alarmes para monitorar a integridade, a capacidade e o desempenho dos seus recursos de nuvem.

A tabela a seguir fornece algumas das principais áreas a serem consideradas ao definir a estratégia de monitoramento da sua organização.

Área Dados a Serem Monitorados
Contas

Gerenciamento de contas

Extensão de assinatura para outras regiões

Criação e supressão de contas administrativas

Violações de cota

Uso de serviços de nuvem

Número de instâncias

Armazenamento, incluindo o uso mais recente, máximo e médio

Contagem de objetos, incluindo procedimentos e views

Número de compartimentos

Recursos subutilizados ou subutilizados

Utilização mensal ou anual de serviços

Métricas

Métricas de negócios

Métricas de segurança

Métricas de desempenho

Métricas financeiras

Faturamento

Orçamento

Cobrança

Cotas de compartimento

Operações

Defina atividades operacionais ou tarefas comuns a serem executadas periodicamente.

Sua estratégia de operações deve incluir as seguintes atividades recomendadas:

  • Definir procedimentos operacionais
  • Estabelecer uma programação de manutenção
  • Usar utilitários de gerenciamento de configuração
  • Fazer backup de dados em armazenamento e bancos de dados
  • Verificar a integridade e o processo de backup
  • Validar segurança e criptografia de backup
  • Replicar seus dados para recuperação de desastre
  • Automatizar o gerenciamento do SO (serviço OS Management Hub)
  • Automatizar a aplicação de patches e a manutenção
  • Ficar atualizado com patches de segurança, correções de bugs e atualizações de aprimoramento
  • Gerenciar limites de serviço e ficar ciente de limites de serviço fixos
  • Considerar o uso de failover em seus limites de serviço
  • Definir cotas de compartimento

Auditing

Use o serviço Audit para obter visibilidade das atividades relacionadas aos recursos e à tenancy do OCI.

Os eventos de log de auditoria podem ser usados para auditorias de segurança, rastreamento de uso e alterações nos recursos do OCI, bem como para ajudar a garantir conformidade com padrões e regulamentos.

Sua estratégia de auditoria deve incluir as seguintes atividades recomendadas:

  • Configurar a auditoria
  • Realizar auditorias
  • Auditar suas políticas. Por exemplo:

    • Onde suas políticas são definidas e estão em conformidade com os padrões da sua organização para uso de compartimentos?
    • Audite o uso de grupos dinâmicos. Esses grupos concedem privilégios em excesso?
    • Quais serviços são configurados e onde estão localizados? Os serviços devem ser limitados a determinados compartimentos ou grupos?
    • Há alguma instrução duplicada que deve ser removida?
    • Existem políticas que concedam privilégios a toda a tenancy?
    • Existem grupos que têm mais privilégios do que precisam?
    • Verificar workflows de longa execução
    • Manter logs do sistema, logs de aplicativos e logs de auditoria
    • Verificar continuamente se há vulnerabilidades

Serviços Events e Notifications

Use o serviço Events para criar automação em sua tenancy. Use o serviço Notifications para obter mensagens sempre que alarmes, conectores de serviço e regras de evento forem acionados.

Eventos são mensagens estruturadas que indicam alterações nos recursos. Os eventos desencadeiam ações, como notificações. Como as regras para eventos se aplicam a eventos no compartimento em que você os cria e a qualquer compartimento filho, recomendamos que você crie regras no nível do compartimento raiz.

O serviço Notifications é um serviço de mensagens multicanal que transmite mensagens a usuários e aplicativos quando ocorrem eventos de interesse no OCI. As mensagens podem ser enviadas a vários protocolos de inscrição, incluindo e-mail, HTTPS, PagerDuty, Slack e o serviço OCI Functions. Alguns canais exigem confirmação da inscrição antes de ela se tornar ativa.

Recomendamos que você crie pelo menos um tópico de notificação e assinatura para receber mensagens relacionadas às métricas do serviço Monitoring.

As notificações também devem ser acionadas quando houver alterações nos seguintes recursos:

  • Provedor de identidades (IdP)
  • Mapeamento de grupo de IdP
  • Grupo do OCI Identity and Access Management (IAM)
  • Política de IAM
  • Usuários
  • Redes virtuais na nuvem (VCNs)
  • Tabelas de roteamento
  • Listas de segurança
  • Grupos de segurança de rede
  • Gateways de rede