Resiliência

Resiliência é a capacidade de um aplicativo ou carga de trabalho de se recuperar rapidamente de falhas e manter a alta disponibilidade. É um aspecto crítico da computação em nuvem porque garante que aplicativos e cargas de trabalho permaneçam acessíveis e funcionais, mesmo quando ocorrem eventos inesperados. As informações a seguir descrevem a resiliência do OCI (Oracle Cloud Infrastructure). As informações destacam a importância da resiliência na computação em nuvem e os recursos de resiliência fornecidos pela OCI. A resiliência deve ser uma consideração importante porque garante a continuidade dos negócios e minimiza o risco de interrupções no serviço.

Recuperar-se de Falhas

A OCI fornece um conjunto de ferramentas e serviços projetados para fornecer um alto nível de resiliência e disponibilidade para aplicativos e cargas de trabalho. Uma oferta é a Plataforma como Serviço (PaaS), que inclui vários mecanismos para recuperação de falhas e garantia de alto tempo de atividade para cargas de trabalho.

Por exemplo, o serviço Autonomous Database, que é um serviço PaaS, oferece tolerância a falhas incorporada e recursos de backup e recuperação automáticos. Em caso de falha, o banco de dados pode alternar automaticamente para um banco de dados stand-by, minimizando o tempo de inatividade e garantindo a continuidade dos processos de negócios críticos.

O OCI fornece recursos automatizados de backup e recuperação para instâncias de computação, permitindo restaurar instâncias para um estado anterior em caso de falha. Esse recurso oferece tranquilidade, sabendo que cargas de trabalho críticas podem ser restauradas para um estado funcional se houver um evento inesperado.

Os recursos de resiliência e disponibilidade fornecidos pela OCI, incluindo serviços PaaS e backup e recuperação automatizados, ajudam a garantir que os aplicativos e cargas de trabalho estejam sempre disponíveis e de bom desempenho. Isso permite que você continue operando e fornecendo serviços aos seus clientes, mesmo diante de eventos inesperados, como falhas de hardware ou outras interrupções.

Alta Disponibilidade

A OCI fornece uma arquitetura robusta e altamente disponível, projetada especificamente para minimizar o tempo de inatividade e garantir que os aplicativos permaneçam acessíveis e funcionais, mesmo diante de falhas. Essa arquitetura é obtida com a implantação de recursos em vários domínios de falha (FD) e domínios de disponibilidade (AD) em uma região. Cada Fault Domain (FD) representa diferentes hardwares físicos em um único domínio de disponibilidade, fornecendo antiafinidade, enquanto cada Availability Domain (AD) é um data center independente isolado de outros ADs, fornecendo redundância e tolerância a falhas. Todos os domínios de disponibilidade contêm três domínios de falha.

Por exemplo, considere um aplicativo altamente disponível, como um com dois servidores Web e um banco de dados clusterizado. Nesse cenário, o posicionamento ideal para cada componente é agrupar um servidor Web e um nó de banco de dados em um domínio de falha e a outra metade de cada par em outro domínio de falha. Essa estratégia de posicionamento garante que uma falha de qualquer domínio de falha não resulte em uma interrupção do aplicativo, pois a outra metade de cada par de componentes continua a funcionar.

A arquitetura altamente disponível fornecida pela OCI, incluindo a implantação de recursos em vários domínios de falha e domínios de disponibilidade, além de regiões emparelhadas para recuperação de desastres, garantem que seus aplicativos e cargas de trabalho permaneçam disponíveis e funcionais, mesmo quando enfrentam eventos inesperados. Isso lhe dá a garantia de que seus serviços permanecerão acessíveis aos seus clientes, ajudando a manter a satisfação do cliente e a continuidade dos negócios. Para obter mais informações, consulte Recomendações do Cloud Adoption Framework e melhores práticas sobre Alta Disponibilidade (HA).

Além disso, a OCI oferece regiões pareadas para recuperação de desastres, permitindo que você replique seus recursos em duas regiões para obter resiliência adicional.

Recuperação de Desastre

Recuperação de desastres (DR) é o processo de restauração de sistemas e infraestrutura de TI após um evento catastrófico. As regiões são independentes de outras regiões e podem ser separadas por grandes distâncias — entre países ou até mesmo continentes. Geralmente, você implantaria um aplicativo na região onde ele é mais usado, porque usar recursos vizinhos é mais rápido do que usar recursos distantes. No entanto, você também pode implantar aplicativos em diferentes regiões para mitigar o risco de eventos catastróficos em toda a região e atender a diferentes requisitos para jurisdições legais, domínios fiscais e outros critérios comerciais ou sociais.

A OCI fornece várias opções de recuperação de desastres, incluindo soluções em espera quentes, quentes e frias. As soluções hot standby fornecem replicação de dados em tempo real e são ideais para cargas de trabalho de missão crítica que exigem tempo de inatividade quase zero. As soluções em espera quentes replicam dados em intervalos e são adequadas para cargas de trabalho que podem tolerar algum tempo de inatividade. As soluções em espera a frio envolvem a restauração manual de sistemas a partir de backups e são adequadas para cargas de trabalho que podem tolerar um tempo de inatividade significativo.

Além disso, a OCI oferece suporte a vários modelos de HA DR, incluindo arquiteturas ativo-passivo e ativo-ativo. As arquiteturas ativo-passivo envolvem a replicação de recursos em um ambiente stand-by que é ativado em caso de falha. As arquiteturas ativas/ativas envolvem a replicação de recursos em várias regiões ou ADs e a distribuição do tráfego entre elas para minimizar o tempo de inatividade.

Arquitetura de Disponibilidade Máxima

A OCI fornece uma variedade de modelos de HA DR altamente eficazes, incluindo arquiteturas ativo-passivo e ativo-ativo, para garantir continuidade contínua e alta disponibilidade de recursos críticos em caso de falha ou manutenção. Por exemplo, em uma arquitetura ativo-passivo, o ambiente stand-by replica os recursos e torna-se ativo somente quando o ambiente principal falha. Por outro lado, uma arquitetura ativo-ativa envolve a replicação de recursos em várias regiões ou ADs para distribuir o tráfego e minimizar o tempo de inatividade.

Para garantir a disponibilidade de aplicativos e bancos de dados de ponta a ponta em níveis ideais, a OCI emprega a Chaos Engineering, uma disciplina que experimenta um sistema para criar confiança em sua capacidade de resistir a condições turbulentas na produção. As Arquiteturas de Disponibilidade Máxima (MAA) aproveitam a Engenharia do Caos ao longo dos ciclos de vida de teste e desenvolvimento, injetando agressivamente várias falhas e eventos de manutenção planejados para avaliar o impacto do aplicativo e do banco de dados. Por meio dessa experimentação, as melhores práticas, defeitos e lições aprendidas são derivadas e colocadas em prática para evoluir e melhorar as soluções de MAA em nuvem da OCI.

O ADB (Automatic Database Backup) na OCI é armazenado no OCI Object Storage e replicado para outro domínio de disponibilidade, permitindo restaurar seus bancos de dados em caso de desastre. Além disso, para o Oracle Autonomous Database on Exadata Cloud@Customer (ADB-C@C), você pode optar por fazer backup no NFS ou no ZDLRA (Zero Data Loss Recovery Appliance); no entanto, você é responsável por configurar e gerenciar a replicação desses backups.

Os modelos avançados de HA DR da OCI, a Chaos Engineering e os backups automáticos de banco de dados com replicação para vários domínios de disponibilidade fornecem proteção abrangente contra possíveis perdas de dados ou falhas do sistema, garantindo a disponibilidade máxima e a continuidade dos recursos críticos.

Tempo Médio para Restauração

O MTTR (Tempo Médio para Restauração) é uma métrica crítica que mede o tempo médio necessário para restaurar um serviço ou sistema após uma falha. Um MTTR prolongado pode causar danos financeiros e de reputação significativos às empresas, levando à perda de receita, diminuição da satisfação do cliente e até mesmo multas regulatórias.

A OCI fornece várias ferramentas e serviços, como Terraform e Ansible, para reduzir o MTTR e garantir a disponibilidade máxima dos serviços. Por exemplo, backups automatizados e processos de recuperação estão disponíveis para recuperar rapidamente dados e aplicativos em caso de interrupção ou desastre. Além disso, a replicação de dados em tempo real em vários domínios de disponibilidade permite a restauração rápida de serviços, minimizando o tempo de inatividade e reduzindo o impacto de falhas.

É essencial medir continuamente o MTTR para entender o tempo necessário para restaurar os serviços em condições desfavoráveis. Essa avaliação é fundamental para identificar áreas de melhoria e reduzir o MTTR ao longo do tempo, garantindo a disponibilidade ideal do serviço e reduzindo o risco de danos causados por tempo de inatividade prolongado.

Integração contínua e implantação contínua

Integração Contínua e Implantação Contínua (CI/CD) são práticas importantes do DevOps que ajudam a agilizar o processo de desenvolvimento de software, aumentar a produtividade e reduzir erros. Essas práticas envolvem automatizar o processo de criação, teste e implantação de software, permitindo que você libere código com mais frequência, com melhor qualidade e consistência.

A OCI suporta essas melhores práticas por meio da integração com ferramentas de CI/CD populares, como Jenkins, GitLab e GitHub. Essas ferramentas fornecem um pipeline automatizado eficiente para desenvolvimento e implantação de software, desde alterações de código até teste e implantação. Ao integrar essas ferramentas à OCI, você pode aproveitar a escalabilidade e a flexibilidade da nuvem para acelerar o processo de desenvolvimento e melhorar a produtividade geral.

Por exemplo, aproveitando o Jenkins na OCI, você pode automatizar os processos de criação e implementação, garantindo que o código seja totalmente testado e implantado rapidamente em ambientes de produção. Da mesma forma, o uso do GitLab na OCI pode permitir uma colaboração perfeita entre as equipes, facilitando o compartilhamento eficiente de códigos e o rastreamento de alterações. Além disso, a integração do GitHub com o OCI fornece uma plataforma para você gerenciar repositórios de código, permitir o controle de versão e facilitar as revisões de código.

O serviço OCI DevOps é um serviço de nuvem totalmente gerenciado projetado para suportar workflows de CI/CD para desenvolvedores. Com essa plataforma, os engenheiros da DevOps podem criar, testar e implementar software e aplicativos facilmente na Oracle Cloud, fornecendo uma solução de ponta a ponta que agiliza o processo de desenvolvimento.

O serviço permite a criação de pipelines de build e implantação DevOps que reduzem erros associados a alterações e minimizam o tempo necessário para criar e implantar releases, melhorando, em última análise, a qualidade e a consistência gerais do código. Além disso, o serviço oferece repositórios Git privados para armazenamento seguro de código e suporta conexões com repositórios de código externos, permitindo uma colaboração simplificada com equipes externas.

Como um serviço de nuvem totalmente gerenciado, o serviço DevOps da OCI fornece dimensionamento e manutenção automatizados, permitindo que você se concentre no código sem se preocupar com o gerenciamento de infraestrutura. Isso garante que a plataforma esteja sempre atualizada e disponível para suportar o processo de desenvolvimento, tornando-a uma solução ideal quando você deseja agilizar os fluxos de trabalho do DevOps e obter ciclos de lançamento mais rápidos com código de alta qualidade.

DevOps, SecOps, DevSecOps, IaC

DevOps, SecOps e DevSecOps são metodologias críticas que permitem atender às demandas de desenvolvimento de software moderno, enfatizando a colaboração, a automação e a segurança. A infraestrutura como código (IaC) desempenha um papel importante para provisionar e configurar a infraestrutura para implantação automatizada.

  • DevOps: Essencial porque promove a colaboração entre as equipes de desenvolvimento e operações, garantindo que o software seja entregue mais rapidamente, com melhor qualidade e mais confiabilidade. Essa metodologia enfatiza a importância da automação, permitindo que as equipes criem, testem e implementem código com mais eficiência, reduzindo o tempo de lançamento no mercado. No OCI, você pode usar as práticas DevOps usando ferramentas como Jenkins, GitLab e GitHub para automatizar o processo de desenvolvimento de software.

  • SecOps: Importante porque ele integra a segurança ao processo de desenvolvimento para garantir que as vulnerabilidades de segurança sejam identificadas e tratadas no início, reduzindo o risco de violações e garantindo a proteção de dados confidenciais. Ao enfatizar a importância da segurança, essa metodologia garante que você possa criar e implantar aplicativos de software seguros. Na OCI, você pode usar integrações com ferramentas de segurança de terceiros, como Check Point e Fortinet, para fornecer detecção e proteção avançadas de ameaças.

  • DevSecOps: Combinação dessas duas metodologias, com segurança integrada ao processo DevOps desde o início. Essa abordagem garante que os aplicativos sejam seguros, confiáveis e atendam aos requisitos de conformidade. Ao se concentrar na segurança desde o início, você pode criar e implementar aplicativos seguros mais rapidamente, com melhor qualidade e mais confiabilidade. Na OCI, você pode usar recursos de segurança integrados, como zonas de segurança, para isolar cargas de trabalho e controlar o tráfego de rede para melhorar a segurança e a resiliência.

  • IaC: Prática importante que envolve a gravação de código para automatizar a implantação e o gerenciamento da infraestrutura. Essa metodologia garante a consistência e a confiabilidade das implantações de infraestrutura, reduzindo o risco de erros e melhorando a resiliência. No OCI, você pode usar ferramentas como Terraform e Ansible para automatizar o provisionamento e a configuração de recursos de infraestrutura.

Automatize Tudo

A automação é um aspecto crucial da construção e manutenção de uma infraestrutura de nuvem resiliente. Ao automatizar processos e tarefas, os erros podem ser reduzidos e a eficiência pode ser aumentada. Criar uma cultura que priorize a automação e a resiliência é essencial para manter a alta disponibilidade na nuvem. Isso pode ser obtido por meio do uso de ferramentas e serviços, como Terraform, Ansible e Jenkins, que fornecem recursos de automação para implantação, configuração e gerenciamento de infraestrutura.

Por exemplo, a OCI fornece uma variedade de ferramentas de automação, incluindo o Resource Manager, que permite automatizar a criação, a configuração e a implantação de recursos de nuvem usando APIs nativas do Terraform ou do Oracle Cloud Infrastructure. Além disso, o uso da automação para executar tarefas rotineiras, como backups e atualizações, pode reduzir significativamente o risco de erros e aumentar a resiliência geral da sua infraestrutura de nuvem.

Requisitos Não Funcionais - SLI, SLO e SLA

Requisitos não funcionais, como desempenho, escalabilidade e disponibilidade, desempenham um papel crucial para garantir que aplicativos e cargas de trabalho atendam às necessidades de negócios. Para conseguir isso, é importante ter métricas que avaliem o desempenho e a disponibilidade de serviços e recursos. Indicadores de Nível de Serviço (SLIs), Objetivos de Nível de Serviço (SLOs) e Acordos de Nível de Serviço (SLAs) são métricas que ajudam a medir a eficácia da sua infraestrutura de nuvem.

A OCI fornece uma variedade de ferramentas e serviços que permitem monitorar e gerenciar essas métricas, incluindo Monitoramento na Nuvem, Registro em Log e Notificações. O Cloud Monitoring permite coletar, analisar e alertar sobre métricas e logs em recursos e serviços da OCI. Ele fornece uma visão unificada da integridade e do desempenho da sua infraestrutura, permitindo que você identifique e solucione problemas rapidamente que possam afetar seus SLIs, SLOs e SLAs. O registro em log permite capturar e analisar dados de log de várias origens, incluindo serviços, aplicações e componentes de infraestrutura da OCI. O Notifications permite que você receba alertas e notificações quando condições predefinidas forem atendidas, permitindo que você tome medidas antes que os problemas afetem seus SLIs, SLOs e SLAs.

Ao aproveitar essas ferramentas e serviços, você pode obter visibilidade profunda de sua infraestrutura de nuvem e monitorar e gerenciar de forma proativa SLIs, SLOs e SLAs. Isso ajuda a garantir que seus aplicativos e cargas de trabalho atendam às necessidades de negócios e permite que eles respondam rapidamente a quaisquer problemas que surjam, minimizando o tempo de inatividade e melhorando a resiliência geral.

Por exemplo, você pode usar o Cloud Monitoring para monitorar o tempo de resposta e a disponibilidade de um aplicativo web hospedado no OCI, enquanto usa o Logging para rastrear erros e diagnosticar problemas de desempenho. As notificações podem ser usadas para alertar os administradores quando ocorrem interrupções de serviço ou problemas de desempenho, permitindo que eles tomem medidas antes que o problema se torne grave.

Domínio de Falha e Disponibilidade

Os domínios de falha e os domínios de disponibilidade são conceitos importantes na computação em nuvem que melhoram a resiliência e reduzem o impacto de possíveis falhas. No caso de uma falha em uma área específica, os domínios de falha podem ser usados para garantir que recursos críticos não sejam impactados, reduzindo o impacto geral no sistema. Os domínios de disponibilidade fornecem isolamento entre data centers para fornecer redundância e tolerância a falhas. Isso garante que, se ocorrer uma falha em um domínio de disponibilidade, a carga de trabalho poderá fazer failover para outro domínio de disponibilidade, garantindo que os serviços permaneçam disponíveis, mesmo em caso de falhas.

A OCI aproveita os domínios de falha e de disponibilidade para fornecer alta disponibilidade. Por exemplo, na OCI, cada região é composta por três domínios de disponibilidade, que são isolados fisicamente uns dos outros e fornecem domínios de falha independentes. A OCI usa domínios de falha para garantir que as instâncias em um determinado domínio de disponibilidade sejam distribuídas em vários domínios de falha, garantindo alta disponibilidade e proteção contra falhas.

Várias Regiões

As regiões da OCI são um componente crucial para garantir a resiliência e a continuidade em caso de desastre. As regiões são duas regiões geograficamente separadas que fornecem redundância e tolerância a falhas. Em caso de evento catastrófico, como desastre natural, ataque cibernético ou erro humano, as regiões emparelhadas garantem que os recursos críticos sejam replicados e estejam disponíveis em uma região alternativa. Isso reduz o risco de tempo de inatividade e perda de dados, proporcionando tranquilidade às empresas e seus clientes.

Por exemplo, se uma empresa opera nos Estados Unidos e há um evento catastrófico, como um desastre natural, agitação política ou queda de energia em uma região, a outra região pode assumir e garantir a continuidade dos negócios. Se a região principal for Leste dos EUA (Ashburn) e estiver passando por uma interrupção, a região secundária Oeste dos EUA (Phoenix) poderá assumir e fornecer os serviços necessários até que a região principal esteja on-line novamente. Essa abordagem garante que a experiência do usuário não seja interrompida e que os dados estejam disponíveis durante a interrupção. A replicação ativa-ativa ou ativa-passiva de recursos da OCI em regiões pareadas garante que os dados estejam continuamente disponíveis, tornando possível fazer failover para a região de backup sem interrupção.

As várias regiões fornecem às empresas a capacidade de implementar um plano eficaz de recuperação de desastres, garantindo que os dados sejam protegidos e que os serviços estejam sempre disponíveis.

Data Guard e GoldenGate

O Data Guard é um recurso do Oracle Database que fornece recuperação de desastres e alta disponibilidade para bancos de dados empresariais. Permite a criação de um banco de dados stand-by que pode assumir o controle se o banco de dados principal falhar. O banco de dados stand-by é sincronizado continuamente com o banco de dados principal, garantindo que os dados estejam sempre atualizados. Isso fornece uma camada adicional de resiliência para sistemas e aplicativos críticos.

GoldenGate é uma ferramenta de integração e replicação de dados que permite a integração de dados em tempo real entre diferentes bancos de dados. Ele suporta integração de dados heterogênea, o que significa que pode replicar dados entre diferentes fornecedores de banco de dados e dentro de um único fornecedor. O GoldenGate também pode ser usado para migração de banco de dados, data warehousing e business intelligence.

A OCI fornece diferentes versões do Data Guard e do GoldenGate para atender a diferentes requisitos e casos de uso. Por exemplo, o Data Guard Standard Edition fornece recursos básicos de recuperação de desastres, enquanto o Data Guard Enterprise Edition fornece recursos mais avançados, como failover automático e proteção de dados. O GoldenGate Standard Edition fornece replicação de dados em tempo real entre bancos de dados, enquanto o GoldenGate Enterprise Edition inclui recursos adicionais, como detecção e resolução de conflitos.

Ao usar essas tecnologias em conjunto com a OCI, você pode melhorar a resiliência do seu sistema garantindo que os dados críticos estejam sempre disponíveis e atualizados, mesmo em caso de desastre ou falha do sistema. Por exemplo, uma empresa de serviços financeiros pode usar o Data Guard para replicar um banco de dados de produção para um banco de dados stand-by em outra região, como as regiões Norte e Sul dos EUA na OCI, para garantir que eles possam se recuperar rapidamente de um evento catastrófico e continuar atendendo os clientes sem interrupção.

Replicação de Datas

A replicação de dados é um aspecto crítico da resiliência na computação em nuvem porque garante que os dados estejam disponíveis mesmo em caso de falha. A replicação envolve a criação de cópias de dados e o armazenamento em vários locais, que podem ser usados para se recuperar de uma falha ou desastre.

O OCI fornece várias opções de armazenamento para replicar dados. O Object Storage é um serviço de armazenamento altamente escalável e durável que permite a replicação de dados entre regiões. Ao configurar a replicação entre regiões, os dados são replicados automaticamente para outra região, fornecendo um alto nível de resiliência. Em caso de desastre ou interrupção, os dados podem ser facilmente acessados do local replicado, garantindo a continuidade dos negócios.

O File Storage fornece sistemas de arquivos altamente disponíveis e duráveis que podem ser acessados por várias instâncias simultaneamente. Usando Políticas de Replicação, os arquivos são replicados automaticamente para outro domínio de disponibilidade, fornecendo tolerância a falhas e alta disponibilidade.

O Block Volume é um serviço de armazenamento em blocos altamente disponível e durável que fornece um recurso de replicação. Ao configurar a Replicação de Volume em Blocos, os dados são replicados automaticamente para outro volume em blocos em outro domínio de disponibilidade dentro da mesma região. Isso garante que os dados estejam disponíveis mesmo em caso de falha ou interrupção.

A replicação de dados é crucial para manter a resiliência na computação em nuvem, e a OCI fornece várias opções para replicar dados entre regiões, domínios de disponibilidade e instâncias. Ao usar essas opções, você pode garantir que seus dados estejam altamente disponíveis, duráveis e facilmente recuperáveis em caso de falha ou desastre.

Calcular Confiabilidade Geral

A confiabilidade é crucial para considerar ao implantar um aplicativo ou carga de trabalho na nuvem. Medir a probabilidade e o impacto de falhas é essencial para garantir o bom funcionamento das operações de negócios. A OCI fornece uma variedade de ferramentas e serviços que ajudam você a calcular a confiabilidade geral e o custo de sua infraestrutura de nuvem. Por exemplo, o Cloud Advisor ajuda a identificar possíveis problemas com sua arquitetura e fornece recomendações para melhorar a confiabilidade, enquanto o Cost Estimator ajuda a estimar o custo de implementação de sua infraestrutura de nuvem. Ao usar essas ferramentas e serviços, você pode garantir que seus aplicativos e cargas de trabalho sejam implementados de maneira confiável e econômica.

Plano de Aplicação de Patch e Upgrade

Manter os aplicativos e a infraestrutura atualizados é importante para manter a segurança e o desempenho ideais na nuvem. Não aplicar os patches e atualizações necessários pode deixar os sistemas vulneráveis a ataques e causar problemas de desempenho que interrompem as operações de negócios. A OCI fornece uma variedade de ferramentas e serviços para ajudar a simplificar e automatizar o processo de aplicação de patches e atualização.

Os serviços Patching Automation e Upgrade Advisor fornecidos pela OCI foram projetados para facilitar o planejamento e a execução do processo de aplicação de patches e upgrade. Além disso, o OSMS (OS Management Service) permite automatizar a aplicação de patches das instâncias do Oracle Linux ou Windows. Com o OSMS, você pode organizar seus sistemas em grupos e programar jobs para aplicar as atualizações mais recentes a todos os sistemas. Esse serviço fornece acesso a uma ampla faixa de origens de software predefinidas, fornecendo a faixa completa de repositórios do Oracle yum para sistemas Linux. Como resultado, os sistemas podem ser mantidos atualizados com os patches mais recentes o tempo todo, melhorando a segurança e o desempenho.

Plano de Continuidade de Negócios

Um plano sólido de continuidade de negócios é essencial para qualquer organização garantir que ela possa continuar operando mesmo diante de eventos disruptivos. Isso pode incluir desastres naturais, interrupções de energia ou ataques cibernéticos.

A OCI fornece uma variedade de ferramentas e serviços para dar suporte a esse tipo de planejamento. Por exemplo, o serviço VPN Site a Site permite criar uma conexão segura e criptografada entre sua rede on-premises e sua Rede Virtual na Nuvem (VCN) da OCI, permitindo que você estenda seu data center para a nuvem. Da mesma forma, o serviço FastConnect fornece uma conexão privada de alta largura de banda entre sua infraestrutura on-premises e seus recursos da OCI, permitindo que você replique dados e execute aplicativos críticos na nuvem.

Uso de Arquitetura Frouxamente Acoplada

A arquitetura fracamente acoplada é um elemento crucial na construção de sistemas resilientes porque ajuda a minimizar o impacto de falhas, reduzindo as dependências entre os componentes. Ao reduzir as dependências, cada componente pode ser dimensionado e evoluído de forma independente, tornando o sistema mais flexível e adaptável às mudanças. A OCI fornece ferramentas e serviços que suportam essa arquitetura, como o Oracle Functions, que permite aos desenvolvedores criar e implementar aplicativos sem servidor que podem ser dimensionados automaticamente com base na demanda da carga de trabalho, sem serem totalmente acoplados a outros componentes. Outro exemplo é o Oracle Kubernetes Engine (OKE), que fornece uma plataforma altamente escalável e flexível para executar aplicativos em contêineres. O OKE usa uma arquitetura baseada em microsserviços que permite criar e implantar aplicativos modulares, fracamente acoplados, que podem ser facilmente dimensionados e gerenciados.

Monitorar e Adaptar para Padrões Incomuns

Para garantir a resiliência do seu sistema, é importante monitorar e adaptar-se a padrões incomuns de uso de recursos, tráfego e comportamento. Esses padrões podem ajudar a identificar possíveis problemas antes que eles se tornem críticos e afetem o desempenho e a disponibilidade do sistema. A OCI fornece ferramentas e serviços, como Cloud Guard e Zonas de Segurança, que fornecem monitoramento e análise contínuos do uso de recursos, tráfego de rede e comportamento do usuário. O Cloud Guard automatiza o monitoramento de seus recursos e ajuda a detectar ameaças de segurança e configurações incorretas em seu ambiente de nuvem. Além disso, as Zonas de Segurança fornecem um ambiente seguro para cargas de trabalho e recursos que exigem níveis mais altos de segurança.

Escolhendo entre SaaS, PaaS e IaaS

A seleção do modelo de serviço de nuvem apropriado é crucial porque determina o nível de controle, flexibilidade e gerenciamento necessários para seus aplicativos e cargas de trabalho. Os modelos de serviço em nuvem, como Software as a Service (SaaS), Platform as a Service (PaaS) e Infrastructure as a Service (IaaS), oferecem vantagens e desvantagens distintas. O SaaS fornece uma solução totalmente gerenciada que pode ser facilmente implantada e requer pouca manutenção, enquanto o PaaS fornece uma plataforma de desenvolvimento com mais opções de controle e personalização. IaaS oferece controle completo sobre a infraestrutura, mas requer mais gerenciamento e manutenção. Escolher o modelo de serviço certo para sua empresa é essencial para maximizar o desempenho, reduzir custos e manter altos níveis de resiliência.

Antecipar Falha

A mitigação do impacto de possíveis falhas é crucial para garantir a resiliência da sua infraestrutura de nuvem. A OCI fornece uma variedade de ferramentas e serviços que permitem antecipar possíveis pontos de falha e planejar sua mitigação. Por exemplo, domínios de falha e domínios de disponibilidade são conceitos usados na computação em nuvem para aumentar a resiliência e reduzir o impacto das falhas. Ao agrupar recursos e distribuí-los entre diferentes domínios de falha e domínios de disponibilidade, você pode minimizar o risco de um único ponto de falha. Além disso, as Zonas de Segurança na OCI permitem isolar cargas de trabalho e reduzir o impacto de incidentes ou falhas de segurança.

Custo Versus Confiabilidade

Para garantir a relação custo-benefício enquanto mantém a confiabilidade, é essencial equilibrar o custo e o desempenho da sua infraestrutura de nuvem. A OCI fornece várias ferramentas e serviços, como Cost Estimator e Cost Management, que ajudam a monitorar e otimizar seus gastos com a nuvem. O Cost Estimator ajuda você a estimar os custos de sua implantação de infraestrutura e identificar possíveis economias de custo. O serviço Cost Management fornece uma plataforma centralizada para monitorar e gerenciar seus gastos com a nuvem em diferentes serviços e regiões. Com esse serviço, você pode definir orçamentos, rastrear o uso e identificar áreas em que pode reduzir custos sem afetar a confiabilidade de sua infraestrutura.

Plano para Grandes Eventos

Garantir alta disponibilidade e evitar interrupções durante grandes eventos, como picos sazonais no tráfego ou janelas de manutenção planejadas, requer um planejamento cuidadoso. A OCI fornece várias ferramentas e serviços, como Dimensionamento Automático e Dimensionamento Programado, que ajudam a planejar e ajustar seus recursos de acordo. O dimensionamento automático ajusta automaticamente a capacidade de seus recursos com base no tráfego em tempo real, garantindo que seu aplicativo esteja disponível para seus usuários. O Escalonamento Programado permite planejar e ajustar os recursos com antecedência para padrões de tráfego previsíveis, reduzindo o risco de excesso de provisionamento e custos desnecessários. Essas ferramentas ajudam você a gerenciar com eficiência seus recursos de nuvem, garantindo alta disponibilidade e desempenho ideal durante grandes eventos.