Suporte e Gerenciamento de Incidentes

O gerenciamento de incidentes é o processo de negócios completo que identifica, analisa e resolve uma indisponibilidade ou interrupção de serviço. O objetivo do gerenciamento de incidentes é manter os serviços em execução ou restaurá-los o mais rápido possível, minimizando o impacto nos negócios.

O Gerenciamento de Incidentes é Importante

Os incidentes de interrupção de serviço podem ser extremamente caros para sua empresa e suas equipes. Os incidentes podem interromper as operações, levar a um período de indisponibilidade temporário e contribuir para a perda de dados e produtividade. O gerenciamento de incidentes fornece às equipes um método confiável para priorizar incidentes, obter uma solução mais rápida e oferecer um serviço melhor para os usuários.

Benefícios do Gerenciamento de Incidentes

Alguns dos benefícios do gerenciamento de incidentes incluem:

  • Maior produtividade e eficiência.
  • Maior visibilidade e transparência.
  • Melhoria do MTTR (tempo médio de resolução). MTTR é uma combinação do tempo médio para detectar, diagnosticar e diminuir incidentes.
  • Melhor experiência do cliente e do funcionário.
  • Prevenção de incidentes.

Suporte ao Oracle Cloud Infrastructure

Ao usar o Oracle Cloud Infrastructure, você às vezes precisa obter ajuda da comunidade ou falar com alguém do suporte técnico da Oracle. Para obter informações sobre opções de suporte, consulte Obtendo Ajuda e Entrando em Contato com o Suporte.

Recomendações

Projete uma estratégia de gerenciamento de incidentes e suporte para dar suporte ao seu ambiente e minimizar interrupções de serviço.

Defina de forma proativa sua estratégia de suporte e gerenciamento de incidentes, sempre que possível, mas aprenda com a experiência e ajuste suas práticas conforme necessário.

Aplique controles para preparar e responder a incidentes. As recomendações incluem:

  • Usar um sistema para determinar riscos, ameaças, vulnerabilidades e impactos relacionados à segurança
  • Usar um sistema de gerenciamento de informações e eventos de segurança (SIEM)
  • Definir um centro de operações de segurança (SOC)
  • Configurar uma equipe de resposta a incidentes
  • Implementar detecção de incidentes, resposta e geração de relatórios
  • Definir caminhos de escalonamento
  • Criar um mecanismo post-mortem padrão

Desenvolva uma estratégia de operações para detectar, prevenir, responder e se recuperar de eventos. As recomendações incluem:

  • Monitorar métricas de desempenho do sistema
  • Documentar e testar um plano de recuperação de desastre
  • Compreender as principais atribuições necessárias para a coordenação de recuperação de desastre
  • Planejar interações com o suporte do Oracle Cloud Infrastructure
  • Responder a incidentes
  • Simular ataques com base em incidentes reais
  • Preparar-se para a falha do aplicativo
  • Recuperar-se de corrompimento de dados
  • Recupere-se de paralisação da rede
  • Recuperar-se de uma falha de serviço dependente
  • Recuperar-se de uma interrupção de serviço em toda a região
  • Aprender com testes de recuperação de desastre e melhorar processos
  • Esperar falhas e aprender com erros

Recomendamos que você formalize um contrato de suporte com a Oracle ou um parceiro aprovado para ajudar a manter os sistemas da sua organização em execução com desempenho máximo. Aproveite essas parcerias quando eventos críticos forem programados, como migrações ou aumentos esperados na demanda. Isso garante que você possa se beneficiar do suporte, das melhores práticas e da experiência certos. Isso também pode garantir um mecanismo de feedback diretamente com o departamento de engenharia da Oracle para melhoria contínua da plataforma.

Explorar Mais

Documentação e outros recursos

My Oracle Support (é necessário fazer log-in):

Painel de Controle de Status do OCI:

Blogs: