Resiliencia

La resiliencia es la capacidad de una aplicación o carga de trabajo para recuperarse rápidamente de fallos y mantener una alta disponibilidad. Es un aspecto crítico de la computación en la nube porque garantiza que las aplicaciones y las cargas de trabajo sigan siendo accesibles y funcionales, incluso cuando se producen eventos inesperados. La siguiente información describe la resiliencia de Oracle Cloud Infrastructure (OCI). La información destaca la importancia de la resiliencia en la computación en la nube y las funciones de resiliencia proporcionadas por OCI. La resiliencia debe ser una consideración clave porque garantiza la continuidad del negocio y minimiza el riesgo de interrupciones del servicio.

Recuperación de Fallos

OCI proporciona un conjunto de herramientas y servicios diseñados para proporcionar un alto nivel de resiliencia y disponibilidad para aplicaciones y cargas de trabajo. Una de las ofertas es la plataforma como servicio (PaaS), que incluye varios mecanismos para recuperarse de fallos y garantizar un alto tiempo de actividad para las cargas de trabajo.

Por ejemplo, el servicio Autonomous Database, que es un servicio PaaS, ofrece tolerancia a fallos incorporada y capacidades de copia de seguridad y recuperación automáticas. En caso de fallo, la base de datos puede realizar automáticamente un switchover a una base de datos en espera, lo que minimiza el tiempo de inactividad y garantiza la continuidad de los procesos de negocio esenciales.

OCI proporciona capacidades automatizadas de copia de seguridad y recuperación para instancias informáticas, lo que le permite restaurar instancias a un estado anterior en caso de fallo. Esta función ofrece tranquilidad, sabiendo que las cargas de trabajo críticas se pueden restaurar a un estado funcional si hay un evento inesperado.

Las funciones de resiliencia y disponibilidad proporcionadas por OCI, incluidos los servicios PaaS y la copia de seguridad y recuperación automatizadas, ayudan a garantizar que las aplicaciones y las cargas de trabajo estén siempre disponibles y tengan un rendimiento excelente. Esto le permite seguir operando y proporcionando servicios a sus clientes, incluso ante eventos inesperados, como fallos de hardware u otras interrupciones.

Alta disponibilidad

OCI proporciona una arquitectura sólida y de alta disponibilidad, diseñada específicamente para minimizar el tiempo de inactividad y garantizar que las aplicaciones permanezcan accesibles y funcionales incluso ante fallos. Esta arquitectura se logra mediante el despliegue de recursos en varios dominios de errores (FD) y dominios de disponibilidad (AD) dentro de una región. Cada dominio de errores (FD) representa un hardware físico diferente dentro de un único dominio de disponibilidad, lo que proporciona antiafinidad, mientras que cada dominio de disponibilidad (AD) es un centro de datos independiente que está aislado de otros dominios de disponibilidad, lo que proporciona redundancia y tolerancia a fallos. Todos los dominios de disponibilidad contienen tres dominios de errores,

Por ejemplo, considere una aplicación de alta disponibilidad, como una con dos servidores web y una base de datos en cluster. En este escenario, la ubicación ideal para cada componente es agrupar un servidor web y un nodo de base de datos en un dominio de errores, y la otra mitad de cada par en otro dominio de errores. Esta estrategia de colocación garantiza que un fallo de un dominio de errores no provoque una interrupción de la aplicación, ya que la otra mitad de cada par de componentes sigue funcionando.

La arquitectura de alta disponibilidad proporcionada por OCI, incluido el despliegue de recursos en varios dominios de errores y dominios de disponibilidad, además de las regiones asociadas para la recuperación ante desastres, garantiza que sus aplicaciones y cargas de trabajo sigan estando disponibles y sean funcionales, incluso cuando se enfrenten a eventos inesperados. Esto le proporciona la garantía de que sus servicios seguirán siendo accesibles para sus clientes, lo que ayuda a mantener la satisfacción del cliente y la continuidad del negocio. Para obtener más información, consulte Recomendaciones y mejores prácticas del marco de adopción de la nube sobre alta disponibilidad (HA).

Además, OCI ofrece regiones emparejadas para la recuperación ante desastres, lo que le permite replicar sus recursos en dos regiones para obtener resiliencia adicional.

Recuperación ante desastres

La recuperación ante desastres (DR) es el proceso de restauración de sistemas e infraestructura de TI después de un evento catastrófico. Las regiones son independientes de otras regiones y se pueden separar con grandes distancias (entre países e incluso continentes). Por lo general, debería desplegar una aplicación en la región en la que se utiliza con mayor frecuencia, ya que la utilización de recursos cercanos es más rápida que la de recursos distantes. Sin embargo, también puede desplegar aplicaciones en diferentes regiones para mitigar el riesgo de eventos catastróficos en toda la región y cumplir con diferentes requisitos para jurisdicciones legales, dominios fiscales y otros criterios empresariales o sociales.

OCI proporciona varias opciones de recuperación ante desastres, incluidas soluciones en espera en caliente, en caliente y en frío. Las soluciones en espera activas proporcionan replicación de datos en tiempo real y son ideales para cargas de trabajo esenciales que requieren un tiempo de inactividad cercano a cero. Las soluciones en espera en caliente replican los datos a intervalos y son adecuadas para cargas de trabajo que pueden tolerar algún tiempo de inactividad. Las soluciones en espera en frío implican la restauración manual de los sistemas a partir de copias de seguridad y son adecuadas para cargas de trabajo que pueden tolerar un tiempo de inactividad significativo.

Además, OCI admite varios modelos de DR de alta disponibilidad, incluidas arquitecturas activo-pasivo y activo-activo. Las arquitecturas activo-pasivo implican la replicación de recursos en un entorno en espera que se activa en caso de fallo. Las arquitecturas activo-activo implican replicar recursos en varias regiones o dominios de disponibilidad y distribuir tráfico entre ellos para minimizar el tiempo de inactividad.

Arquitectura de Máxima Disponibilidad

OCI proporciona una gama de modelos de DR de alta disponibilidad altamente eficaces, incluidas arquitecturas activo-pasivo y activo-activo, para garantizar una continuidad perfecta y una alta disponibilidad de recursos críticos en caso de fallo o mantenimiento. Por ejemplo, en una arquitectura activo-pasivo, el entorno en espera replica los recursos y se activa sólo cuando falla el entorno principal. Por el contrario, una arquitectura activo-activo implica la replicación de recursos en varias regiones o dominios de disponibilidad para distribuir el tráfico y minimizar el tiempo de inactividad.

Para garantizar la disponibilidad completa de aplicaciones y bases de datos en niveles óptimos, OCI emplea Chaos Engineering, una disciplina que experimenta con un sistema para generar confianza en su capacidad de soportar condiciones turbulentas en la producción. Las arquitecturas de máxima disponibilidad (MAA) aprovechan la ingeniería del caos a lo largo de los ciclos de vida de prueba y desarrollo, inyectando agresivamente varios fallos y eventos de mantenimiento planificados para evaluar el impacto de la aplicación y la base de datos. A través de esta experimentación, se derivan las mejores prácticas, los defectos y las lecciones aprendidas y se ponen en práctica para evolucionar y mejorar las soluciones de MAA en la nube de OCI.

La copia de seguridad automática de base de datos (ADB) en OCI se almacena en OCI Object Storage y se replica en otro dominio de disponibilidad, lo que le permite restaurar sus bases de datos en caso de desastre. Además, para Oracle Autonomous Database on Exadata Cloud@Customer (ADB-C@C), puede elegir realizar una copia de seguridad en NFS o Zero Data Loss Recovery Appliance (ZDLRA); sin embargo, es responsable de configurar y gestionar la replicación de esas copias de seguridad.

Los modelos avanzados de DR de alta disponibilidad de OCI, la ingeniería del caos y las copias de seguridad automáticas de bases de datos con replicación en varios dominios de disponibilidad le proporcionan una protección completa contra posibles pérdidas de datos o fallos del sistema, lo que garantiza la máxima disponibilidad y continuidad de los recursos críticos.

Tiempo promedio para restaurar

El tiempo medio de restauración (MTTR) es una métrica crítica que mide el tiempo medio que se tarda en restaurar un servicio o sistema después de un fallo. Un MTTR prolongado puede causar daños financieros y de reputación significativos a las empresas, lo que lleva a la pérdida de ingresos, la disminución de la satisfacción del cliente e incluso multas regulatorias.

OCI proporciona varias herramientas y servicios, como Terraform y Ansible, para reducir el MTTR y garantizar la máxima disponibilidad de los servicios. Por ejemplo, las copias de seguridad automatizadas y los procesos de recuperación están disponibles para recuperar rápidamente datos y aplicaciones en caso de una interrupción o desastre. Además, la replicación de datos en tiempo real en varios dominios de disponibilidad permite la restauración rápida de los servicios, minimizando el tiempo de inactividad y reduciendo el impacto de los fallos.

Es esencial medir continuamente el MTTR para comprender el tiempo necesario para restaurar los servicios en condiciones desfavorables. Esta evaluación es fundamental para identificar áreas de mejora y reducir el MTTR a lo largo del tiempo, garantizar una disponibilidad óptima del servicio y reducir el riesgo de daños causados por un tiempo de inactividad prolongado.

Integración y despliegue continuos

La integración continua y el despliegue continuo (CI/CD) son prácticas importantes de DevOps que le ayudan a optimizar el proceso de desarrollo de software, aumentar la productividad y reducir los errores. Estas prácticas implican la automatización del proceso de creación, prueba e implementación de software, lo que le permite publicar código con mayor frecuencia, con una calidad y coherencia mejoradas.

OCI soporta estas mejores prácticas mediante la integración con herramientas populares de integración y despliegue continuos, como Jenkins, GitLab y GitHub. Estas herramientas proporcionan un pipeline automatizado eficiente para el desarrollo y despliegue de software, desde cambios de código hasta pruebas y despliegues. Al integrar estas herramientas en OCI, puedes aprovechar la escalabilidad y flexibilidad de la nube para acelerar el proceso de desarrollo y mejorar la productividad general.

Por ejemplo, al aprovechar Jenkins en OCI, puedes automatizar los procesos de creación y despliegue, garantizando que el código se pruebe exhaustivamente y se despliegue rápidamente en entornos de producción. Del mismo modo, el uso de GitLab en OCI puede permitir una colaboración fluida entre equipos, lo que facilita el uso compartido eficiente del código y el seguimiento de los cambios. Además, la integración de GitHub con OCI proporciona una plataforma para gestionar repositorios de código, activar el control de versiones y facilitar las revisiones de código.

El servicio OCI DevOps es un servicio en la nube totalmente gestionado diseñado para admitir flujos de trabajo de integración y despliegue continuos para desarrolladores. Con esta plataforma, los ingenieros de DevOps pueden crear, probar e implementar software y aplicaciones fácilmente en Oracle Cloud, proporcionando una solución integral que optimiza el proceso de desarrollo.

El servicio permite la creación de pipelines de creación y despliegue de DevOps que reducen los errores asociados al cambio y minimizan el tiempo necesario para crear y desplegar versiones, lo que en última instancia mejora la calidad general y la coherencia del código. Además, el servicio ofrece repositorios Git privados para el almacenamiento de código seguro y admite conexiones a repositorios de código externos, lo que permite una colaboración optimizada con equipos externos.

Como servicio en la nube totalmente gestionado, el servicio DevOps de OCI proporciona escalabilidad y mantenimiento automatizados, lo que le permite centrarse en el código sin preocuparse por la gestión de la infraestructura. Esto garantiza que la plataforma esté siempre actualizada y disponible para soportar el proceso de desarrollo, lo que la convierte en una solución ideal cuando desea optimizar los flujos de trabajo de DevOps y lograr ciclos de versiones más rápidos con código de mayor calidad.

DevOps, SecOps, DevSecOps, IaC

DevOps, SecOps y DevSecOps son metodologías críticas que le permiten satisfacer las demandas del desarrollo de software moderno haciendo hincapié en la colaboración, la automatización y la seguridad. La infraestructura como código (IaC) desempeña un papel importante para aprovisionar y configurar la infraestructura para el despliegue automatizado.

  • DevOps: esencial porque fomenta la colaboración entre los equipos de desarrollo y operaciones, lo que garantiza que el software se entregue más rápido, con mejor calidad y más fiabilidad. Esta metodología enfatiza la importancia de la automatización, permitiendo a los equipos crear, probar e implementar código de manera más eficiente, reduciendo el tiempo de comercialización. En OCI, puede utilizar las prácticas de DevOps mediante herramientas como Jenkins, GitLab y GitHub para automatizar el proceso de desarrollo de software.

  • SecOps: importante porque integra la seguridad en el proceso de desarrollo para garantizar que las vulnerabilidades de seguridad se identifiquen y aborden desde el principio, lo que reduce el riesgo de infracciones y garantiza la protección de los datos confidenciales. Al enfatizar la importancia de la seguridad, esta metodología garantiza que pueda crear e implementar aplicaciones de software seguras. En OCI, puedes utilizar integraciones con herramientas de seguridad de terceros como Check Point y Fortinet para proporcionar detección y protección avanzadas de amenazas.

  • DevSecOps: combinación de estas dos metodologías, con seguridad integrada en el proceso DevOps desde el principio. Este enfoque garantiza que las aplicaciones sean seguras, fiables y cumplan los requisitos de conformidad. Al centrarse en la seguridad desde el principio, puede crear y desplegar aplicaciones seguras más rápido, con una mejor calidad y más fiabilidad. En OCI, puedes utilizar funciones de seguridad integradas, como zonas de seguridad, para aislar cargas de trabajo y controlar el tráfico de red para mejorar la seguridad y la resiliencia.

  • IaC: práctica importante que implica escribir código para automatizar el despliegue y la gestión de la infraestructura. Esta metodología garantiza la consistencia y fiabilidad de las implementaciones de infraestructura, reduciendo el riesgo de errores y mejorando la resiliencia. En OCI, puede utilizar herramientas como Terraform y Ansible para automatizar el aprovisionamiento y la configuración de los recursos de infraestructura.

Automatice todo

La automatización es un aspecto crucial para crear y mantener una infraestructura en la nube resiliente. Mediante la automatización de procesos y tareas, se pueden reducir los errores y aumentar la eficiencia. Crear una cultura que priorice la automatización y la resiliencia es esencial para mantener una alta disponibilidad en la nube. Esto se puede lograr mediante el uso de herramientas y servicios como Terraform, Ansible y Jenkins, que proporcionan capacidades de automatización para el despliegue, la configuración y la gestión de la infraestructura.

Por ejemplo, OCI proporciona una gama de herramientas de automatización, incluido Resource Manager, que le permite automatizar la creación, configuración y despliegue de recursos en la nube mediante las API nativas de Terraform u Oracle Cloud Infrastructure. Además, el uso de la automatización para realizar tareas rutinarias como copias de seguridad y actualizaciones puede reducir significativamente el riesgo de errores y aumentar la resiliencia general de su infraestructura en la nube.

Requisitos no funcionales: SLI, SLO y SLA

Los requisitos no funcionales, como el rendimiento, la escalabilidad y la disponibilidad, desempeñan un papel crucial a la hora de garantizar que las aplicaciones y las cargas de trabajo satisfagan las necesidades empresariales. Para lograrlo, es importante contar con métricas que midan el rendimiento y la disponibilidad de los servicios y recursos. Los indicadores de nivel de servicio (SLI), los objetivos de nivel de servicio (SLO) y los acuerdos de nivel de servicio (SLA) son métricas que le ayudan a medir la eficacia de su infraestructura en la nube.

OCI proporciona una gama de herramientas y servicios que le permiten supervisar y gestionar estas métricas, incluidos Cloud Monitoring, Logging y Notifications. Cloud Monitoring le permite recopilar, analizar y alertar sobre métricas y logs en todos los recursos y servicios de OCI. Proporciona una vista unificada del estado y el rendimiento de la infraestructura, lo que le permite identificar y solucionar rápidamente problemas que podrían afectar a sus SLI, SLO y SLA. Logging permite capturar y analizar datos de log de varios orígenes, incluidos servicios, aplicaciones y componentes de infraestructura de OCI. Notifications le permite recibir alertas y notificaciones cuando se cumplen las condiciones predefinidas, lo que le permite tomar medidas antes de que los problemas afecten a sus SLI, SLO y SLA.

Al aprovechar estas herramientas y servicios, puede obtener una gran visibilidad de su infraestructura en la nube, así como supervisar y gestionar de forma proactiva los SLI, los SLO y los SLA. Esto ayuda a garantizar que sus aplicaciones y cargas de trabajo satisfagan las necesidades empresariales y les permite responder rápidamente a cualquier problema que surja, minimizando el tiempo de inactividad y mejorando la resiliencia general.

Por ejemplo, puede utilizar Cloud Monitoring para supervisar el tiempo de respuesta y la disponibilidad de una aplicación web alojada en OCI, mientras utiliza Logging para realizar un seguimiento de los errores y diagnosticar problemas de rendimiento. Las notificaciones se pueden utilizar para alertar a los administradores cuando se producen interrupciones del servicio o problemas de rendimiento, lo que les permite tomar medidas antes de que el problema se agrave.

Dominio de errores y disponibilidad

Los dominios de errores y los dominios de disponibilidad son conceptos importantes de la computación en la nube que mejoran la resiliencia y reducen el impacto de posibles fallos. En caso de que se produzca un fallo en un área concreta, los dominios de errores se pueden utilizar para garantizar que los recursos críticos no se vean afectados, lo que reduce el impacto general en el sistema. Los dominios de disponibilidad proporcionan aislamiento entre los centros de datos para proporcionar redundancia y tolerancia a fallos. Esto garantiza que si se produce un fallo en un dominio de disponibilidad, la carga de trabajo puede realizar un failover en otro dominio de disponibilidad, lo que garantiza que los servicios permanezcan disponibles, incluso en caso de fallos.

OCI aprovecha los dominios de errores y los dominios de disponibilidad para proporcionarle alta disponibilidad. Por ejemplo, en OCI, cada región se compone de tres dominios de disponibilidad, que están físicamente aislados entre sí y proporcionan dominios de fallo independientes. OCI utiliza dominios de errores para garantizar que las instancias de un dominio de disponibilidad determinado se distribuyan entre varios dominios de errores, lo que garantiza una alta disponibilidad y protección frente a fallos.

Varias regiones

Las regiones de OCI son un componente crucial para garantizar la resiliencia y la continuidad en caso de desastre. Las regiones son dos regiones separadas geográficamente que proporcionan redundancia y tolerancia a fallos. En caso de un evento catastrófico como un desastre natural, un ciberataque o un error humano, las regiones emparejadas garantizan que los recursos críticos se replican y estén disponibles en una región alternativa. Esto reduce el riesgo de tiempo de inactividad y pérdida de datos, proporcionando tranquilidad a las empresas y sus clientes.

Por ejemplo, si un negocio opera en los Estados Unidos y hay un evento catastrófico como un desastre natural, disturbios políticos o cortes de energía en una región, la otra región puede asumir el control y garantizar la continuidad del negocio. Si la región principal es este de EE. UU. (Ashburn) y experimenta una interrupción, la región secundaria oeste de EE. UU. (Phoenix) puede hacerse cargo y proporcionar los servicios necesarios hasta que la región principal vuelva a estar en línea. Este enfoque garantiza que la experiencia del usuario no se interrumpa y que los datos estén disponibles durante toda la interrupción. La replicación activo-activo o activo-pasivo de OCI de recursos en regiones emparejadas garantiza que los datos estén disponibles continuamente, lo que permite realizar un failover en la región de copia de seguridad sin interrupciones.

Las múltiples regiones proporcionan a las empresas la capacidad de implementar un plan de recuperación ante desastres eficaz, garantizando que los datos estén protegidos y que los servicios estén siempre disponibles.

Data Guard y GoldenGate

Data Guard es una función de Oracle Database que proporciona recuperación ante desastres y alta disponibilidad para bases de datos empresariales. Permite la creación de una base de datos en espera que puede asumir el control si falla la base de datos primaria. La base de datos en espera se sincroniza continuamente con la base de datos primaria, lo que garantiza que los datos estén siempre actualizados. Esto proporciona una capa adicional de resiliencia para sistemas y aplicaciones esenciales.

GoldenGate es una herramienta de replicación e integración de datos que permite la integración de datos en tiempo real entre diferentes bases de datos. Admite la integración de datos heterogéneos, lo que significa que puede replicar datos entre diferentes proveedores de bases de datos y dentro de un único proveedor. GoldenGate también se puede utilizar para la migración de bases de datos, el almacenamiento de datos y la inteligencia empresarial.

OCI proporciona diferentes versiones de Data Guard y GoldenGate para cumplir diferentes requisitos y casos de uso. Por ejemplo, Data Guard Standard Edition proporciona capacidades básicas de recuperación ante desastres, mientras que Data Guard Enterprise Edition proporciona funciones más avanzadas, como failover automático y protección de datos. GoldenGate Standard Edition proporciona replicación de datos en tiempo real entre bases de datos, mientras que GoldenGate Enterprise Edition incluye funciones adicionales como la detección y resolución de conflictos.

Al utilizar estas tecnologías junto con OCI, puedes mejorar la resiliencia de tu sistema asegurándote de que los datos críticos estén siempre disponibles y actualizados, incluso en caso de desastre o fallo del sistema. Por ejemplo, una compañía de servicios financieros puede utilizar Data Guard para replicar una base de datos de producción en una base de datos en espera en una región diferente, como las regiones norte y sur de EE. UU. en OCI, para garantizar que puedan recuperarse rápidamente de un evento catastrófico y seguir prestando servicio a los clientes sin interrupción.

Replicación de fecha

La replicación de datos es un aspecto crítico de la resiliencia en la computación en la nube, ya que garantiza que los datos estén disponibles incluso en caso de fallo. La replicación implica la creación de copias de datos y su almacenamiento en varias ubicaciones, que se pueden utilizar para recuperarse de un fallo o desastre.

OCI proporciona varias opciones de almacenamiento para replicar datos. El almacenamiento de objetos es un servicio de almacenamiento duradero y con grandes posibilidades de ampliación que permite la replicación de datos en varias regiones. Al configurar la replicación entre regiones, los datos se replican automáticamente en otra región, lo que proporciona un alto nivel de resiliencia. En caso de desastre o interrupción, se puede acceder fácilmente a los datos desde la ubicación replicada, lo que garantiza la continuidad del negocio.

El almacenamiento de archivos proporciona sistemas de archivos duraderos y de alta disponibilidad a los que pueden acceder varias instancias a la vez. Mediante el uso de políticas de replicación, los archivos se replican automáticamente en otro dominio de disponibilidad, lo que proporciona tolerancia a fallos y alta disponibilidad.

Block Volume es un servicio de almacenamiento de bloques duradero y de alta disponibilidad que proporciona una función de replicación. Al configurar la replicación de volumen en bloque, los datos se replican automáticamente en otro volumen en bloque en un dominio de disponibilidad diferente de la misma región. Esto garantiza que los datos estén disponibles incluso en caso de fallo o interrupción.

La replicación de datos es crucial para mantener la resiliencia en la computación en la nube, y OCI proporciona varias opciones para replicar datos entre regiones, dominios de disponibilidad e instancias. Con estas opciones, puede garantizar que los datos sean de alta disponibilidad, duraderos y fáciles de recuperar en caso de fallo o desastre.

Calcular fiabilidad general

La fiabilidad es fundamental a la hora de desplegar una aplicación o una carga de trabajo en la nube. La medición de la probabilidad y el impacto de los fallos es esencial para garantizar el buen funcionamiento de las operaciones comerciales. OCI proporciona una gama de herramientas y servicios que te ayudan a calcular la fiabilidad general y el costo de tu infraestructura en la nube. Por ejemplo, Cloud Advisor le ayuda a identificar posibles problemas con su arquitectura y proporciona recomendaciones para mejorar la fiabilidad, mientras que el estimador de costos le ayuda a estimar el costo de la implantación de su infraestructura en la nube. Con estas herramientas y servicios, puede garantizar que las aplicaciones y cargas de trabajo se desplieguen de forma fiable y rentable.

Plan para la aplicación de parches y la actualización

Mantener las aplicaciones y la infraestructura actualizadas es importante para mantener una seguridad y un rendimiento óptimos en la nube. Si no se aplican los parches y las actualizaciones necesarios, los sistemas pueden ser vulnerables a los ataques y pueden causar problemas de rendimiento que interrumpan las operaciones de negocio. OCI proporciona una gama de herramientas y servicios para ayudar a optimizar y automatizar el proceso de aplicación de parches y actualización.

Los servicios de automatización de parches y asesor de actualizaciones proporcionados por OCI están diseñados para facilitar la planificación y ejecución del proceso de aplicación de parches y actualización. Además, OS Management Service (OSMS) permite automatizar la aplicación de parches de instancias de Oracle Linux o Windows. Con OSMS, puede organizar los sistemas en grupos y programar trabajos para aplicar las últimas actualizaciones a todos los sistemas. Este servicio proporciona acceso a una amplia gama de orígenes de software predefinidos, lo que proporciona toda la gama de repositorios de Oracle yum para sistemas Linux. Como resultado, los sistemas se pueden mantener actualizados con los parches más recientes todo el tiempo, lo que mejora la seguridad y el rendimiento.

Plan de continuidad de negocio

Un plan sólido de continuidad del negocio es esencial para que cualquier organización pueda continuar operando incluso ante eventos disruptivos. Estos podrían incluir desastres naturales, cortes de energía o ciberataques.

OCI proporciona una gama de herramientas y servicios para respaldar este tipo de planificación. Por ejemplo, el servicio de VPN de sitio a sitio le permite crear una conexión cifrada y segura entre su red local y su red virtual en la nube (VCN) de OCI, lo que le permite ampliar su centro de datos a la nube. Del mismo modo, el servicio FastConnect proporciona una conexión privada de gran ancho de banda entre su infraestructura local y sus recursos de OCI, lo que le permite replicar datos y ejecutar aplicaciones esenciales en la nube.

Uso de la arquitectura débilmente acoplada

La arquitectura débilmente acoplada es un elemento crucial en la creación de sistemas resilientes, ya que ayuda a minimizar el impacto de los fallos al reducir las dependencias entre los componentes. Al reducir las dependencias, cada componente se puede escalar y evolucionar de forma independiente, lo que hace que el sistema sea más flexible y adaptable a los cambios. OCI proporciona herramientas y servicios que soportan esta arquitectura, como Oracle Functions, que permite a los desarrolladores crear e implementar aplicaciones sin servidor que se pueden escalar automáticamente en función de la demanda de la carga de trabajo, sin estar estrechamente acopladas a otros componentes. Otro ejemplo es Oracle Kubernetes Engine (OKE), que proporciona una plataforma altamente escalable y flexible para ejecutar aplicaciones en contenedores. OKE utiliza una arquitectura basada en microservicios que le permite crear e implementar aplicaciones modulares acopladas de forma flexible que se pueden escalar y gestionar fácilmente.

Control y adaptación de patrones inusuales

Para garantizar la resiliencia de su sistema, es importante supervisar y adaptarse a patrones inusuales de uso de recursos, tráfico y comportamiento. Estos patrones pueden ayudar a identificar posibles problemas antes de que se vuelvan críticos y afecten al rendimiento y la disponibilidad del sistema. OCI proporciona herramientas y servicios como Cloud Guard y Security Zones que proporcionan supervisión y análisis continuos del uso de recursos, el tráfico de red y el comportamiento del usuario. Cloud Guard automatiza la supervisión de sus recursos y ayuda a detectar amenazas de seguridad y configuraciones incorrectas en su entorno en la nube. Además, Security Zones proporciona un entorno seguro para cargas de trabajo y recursos que requieren mayores niveles de seguridad.

Selección de SaaS, PaaS y IaaS

La selección del modelo de servicio en la nube adecuado es crucial porque determina el nivel de control, flexibilidad y gestión necesarios para sus aplicaciones y cargas de trabajo. Los modelos de servicio en la nube como el software como servicio (SaaS), la plataforma como servicio (PaaS) y la infraestructura como servicio (IaaS) proporcionan ventajas y desventajas distintas. SaaS proporciona una solución totalmente gestionada que se puede desplegar fácilmente y requiere poco mantenimiento, mientras que PaaS proporciona una plataforma de desarrollo con más opciones de control y personalización. IaaS ofrece un control completo de la infraestructura, pero requiere más gestión y mantenimiento. Elegir el modelo de servicio adecuado para su negocio es esencial para maximizar el rendimiento, reducir los costos y mantener altos niveles de resiliencia.

Anticipar fallo

Mitigar el impacto de posibles fallos es crucial para garantizar la resiliencia de su infraestructura en la nube. OCI proporciona una variedad de herramientas y servicios que le permiten anticipar posibles puntos de fallo y planificar su mitigación. Por ejemplo, los dominios de errores y los dominios de disponibilidad son conceptos que se utilizan en la computación en la nube para aumentar la resiliencia y reducir el impacto de los fallos. Al agrupar los recursos y distribuirlos entre distintos dominios de errores y dominios de disponibilidad, puede minimizar el riesgo de un único punto de fallo. Además, Security Zones en OCI te permite aislar cargas de trabajo y reducir el impacto de los incidentes o fallos de seguridad.

Costo frente a fiabilidad

Para garantizar la rentabilidad y mantener la fiabilidad, es esencial equilibrar el costo y el rendimiento de la infraestructura en la nube. OCI proporciona diversas herramientas y servicios, como el estimador de costos y la gestión de costos, que le ayudan a supervisar y optimizar el gasto en la nube. El estimador de costos le ayuda a estimar los costos del despliegue de su infraestructura e identificar posibles ahorros de costos. El servicio de gestión de costos proporciona una plataforma centralizada para controlar y gestionar el gasto en la nube en distintos servicios y regiones. Con este servicio, puede definir presupuestos, realizar un seguimiento del uso e identificar áreas en las que puede reducir costos sin que esto afecte a la fiabilidad de su infraestructura.

Plan para grandes eventos

Asegurar una alta disponibilidad y evitar interrupciones durante grandes eventos, como picos estacionales en el tráfico o ventanas de mantenimiento planificadas, requiere una planificación cuidadosa. OCI proporciona varias herramientas y servicios, como la escala automática y la escala programada, que le ayudan a planificar y ajustar los recursos según corresponda. La escala automática ajusta automáticamente la capacidad de sus recursos en función del tráfico en tiempo real, lo que garantiza que la aplicación esté disponible para sus usuarios. La escala programada le permite planificar y ajustar los recursos de antemano para patrones de tráfico predecibles, lo que reduce el riesgo de sobreaprovisionamiento y costos innecesarios. Estas herramientas le ayudan a gestionar de forma eficiente sus recursos en la nube, lo que garantiza una alta disponibilidad y un rendimiento óptimo durante grandes eventos.