Control de la carga de trabajo

Comprenda y adopte un proceso de supervisión para todos los servicios de Oracle Cloud Infrastructure. El servicio Monitoring utiliza métricas para supervisar recursos y alarmas para notificarle cuando las métricas alcanzan los disparadores especificados por la alarma.

Analizar Métricas de Operación

Arquitecto de red, mánager de operaciones en la nube, arquitecto de seguridad

Defina, capture y analice las métricas de operaciones para obtener visibilidad de los eventos.

El servicio de Oracle Cloud Infrastructure Monitoring ofrece la información necesaria para comprender el estado de sus recursos, optimizar el rendimiento de sus aplicaciones y responder a anomalías en tiempo real. Puede configurar alarmas para que le avisen en tiempo real de cambios importantes en su infraestructura y servicios en la nube, lo que le permite realizar rápidamente las acciones adecuadas.

Definir comprobaciones del sistema

Arquitecto de nube, mánager de operaciones en la nube, arquitecto de seguridad

El servicio Oracle Cloud Infrastructure Health Checks proporciona a los usuarios una supervisión externa de alta frecuencia para determinar la disponibilidad y el rendimiento de cualquier servicio orientado al público, incluidos los sitios web alojados, los puntos finales de API o los equilibradores de carga externos.

Utilice Oracle Cloud Infrastructure Health Checks para asegurarse de que conoce inmediatamente cualquier problema de disponibilidad que afecte a sus clientes.

Supervisar servicios informáticos

Director de operaciones en la nube, arquitecto de seguridad

Asegúrese de que su equipo de operaciones utiliza y aplica métricas de servicios informáticos.

Utilice métricas, alarmas y notificaciones para supervisar lo siguiente:

  • Instancia informática: controle el estado, la capacidad y el rendimiento de sus instancias informáticas.
  • Estado de la infraestructura: control del estado, la capacidad y el rendimiento de las instancias con hardware dedicado de los recursos informáticos
  • Oracle Cloud Infrastructure Functions: supervise el estado, la capacidad y el rendimiento de las funciones desplegadas en Oracle Cloud Infrastructure Functions.
  • Estado de la base de datos: supervise el estado, la capacidad y el rendimiento de los servicios de base de datos. Oracle Cloud Observability and Management Platform proporciona capacidades unificadas de supervisión y administración de bases de datos para bases de datos en la nube.
  • Estado del sistema operativo: implemente herramientas de registro de nivel de sistema operativo, como auditd.

Supervise sus redes

Arquitecto de red, mánager de operaciones en la nube, arquitecto de seguridad

Adopte un mecanismo en el que las métricas se apliquen en diferentes puntos finales de red. Puede tener métricas para la red virtual en la nube (VCN) interna y también para la conectividad (VPN de Oracle Cloud Infrastructure FastConnect y IPsec) o el equilibrador de carga.

Utilice métricas, alarmas y notificaciones para supervisar lo siguiente:

  • Métricas de VNIC: supervise el estado, la capacidad y el rendimiento de las VNIC del servicio Networking (tarjetas de interfaz de red virtual).
  • Métricas de FastConnect: supervise el estado, la capacidad y el rendimiento de la conexión entre la red local y la VCN (conexión de Oracle Cloud Infrastructure FastConnect).
  • Métricas de conexión VPN: supervise el estado, la capacidad y el rendimiento de la conexión entre la red local y la VCN (también conocida como VPN IPSec).
  • Métricas de gateway de servicio: supervise el estado, la capacidad y el rendimiento de los gateways de servicio, que permiten a los hosts locales o los hosts de VCN acceder de forma privada a los servicios de Oracle (como Object Storage y Autonomous Database) sin exponer los recursos a la red pública de Internet.
  • Métricas de equilibrio de carga: supervise el estado, la capacidad y el rendimiento de los equilibradores de carga, que actúan como intermediarios del tráfico de datos entre los clientes y los servidores de aplicaciones.
  • Equipo local de cliente: supervise el estado, la capacidad y el rendimiento del equipo fronterizo en la red que se conecta a Oracle Cloud Infrastructure (OCI).
  • Active los logs de flujo de VCN e ingérelos con Oracle Cloud Logging Analytics para analizarlos e identificar patrones interesantes y obtener estadísticas, según sea necesario.

Utilice OCI Network Command Center y las herramientas disponibles para supervisar y observar la red. OCI Network Command Center ofrece las siguientes herramientas de observabilidad para admitir varios casos de uso de operaciones:

  • Visualizador de red

    Ofrece una visualización de topología intuitiva para comprender las conexiones y relaciones entre los recursos de red virtual, inspeccionar la configuración desde un lugar y solucionar visualmente cualquier problema de configuración.

  • Analizador de rutas de red

    Permite solucionar problemas de configuraciones de red virtual complejas cuando tiene problemas de accesibilidad. Proporciona análisis de configuración automatizados para determinar la ruta de red que toma el tráfico, identificar problemas de configuración de seguridad y enrutamiento y proporcionar información de configuración a lo largo de la ruta.

  • Latencia entre regiones

    Proporciona información de latencia histórica y en tiempo real entre regiones de OCI.

  • Logs de flujo de VCN

    Ofrece telemetría de tráfico de red, fundamental para respaldar sus casos de uso de operaciones de red y seguridad. Puede obtener amplias estadísticas sobre el tráfico de red, transmitir los logs de flujo a la herramienta elegida mediante protocolos estándar como Kafka y archivar los logs de flujo en OCI Object Storage con fines de conformidad. Los logs de flujo de VCN se pueden enviar a Oracle Cloud Infrastructure Logging Analytics, OCI Object Storage o a un sistema de terceros.

  • Punto de acceso de prueba virtual (VTAP)

    Ofrece capacidades de duplicación de tráfico que permiten la captura completa de paquetes para análisis de seguridad, resolución de problemas de aplicaciones o problemas de rendimiento de red. VTAP también es útil para resolver problemas complejos de red mediante el análisis del contenido y los encabezados de los paquetes.

Supervisar datos

Arquitecto de nube, mánager de operaciones en la nube, arquitecto de seguridad

Controle los servicios de almacenamiento que utiliza para almacenar datos mediante métricas, alarmas y notificaciones.
  • Métricas de volumen en bloque: supervise el rendimiento y las operaciones de los volúmenes en bloque y los volúmenes de inicio.
  • Métricas de Object Storage: supervise el tamaño y el número de objetos de los cubos de Object Storage.
  • Métricas del sistema de archivos: supervise el estado, el rendimiento, las solicitudes y la latencia de los sistemas de archivos y los destinos de montaje.

Creación de un juego de alarmas para cada métrica

DevOps Arquitecto, jefe de operaciones en la nube, arquitecto de seguridad

Cree un juego de alarmas para las métricas de servicio relevantes. Para cada métrica emitida por los recursos, cree alarmas que definan los comportamientos de recursos.
  • En riesgo. Existe el riesgo de que el recurso deje de estar operativo según lo indicado por los valores de las métricas.
  • No óptimo. El recurso está funcionando a un nivel que no es óptimo según lo indicado por los valores de las métricas.
  • El recurso está activo o caído. El recurso no está accesible o no funciona.

Ajuste de las alarmas

DevOps Arquitecto, jefe de operaciones en la nube, arquitecto de seguridad

Revise las alarmas de forma periódica, por ejemplo, semanalmente, para garantizar que la configuración sea óptima. Calibre los detalles de umbral, gravedad y notificación de cada alarma, incluidos el método, la frecuencia y el público objetivo.
Los umbrales de métrica demasiado amplios alertarán innecesariamente, mientras que los umbrales demasiado ajustados reducirán el tiempo para realizar acciones correctivas antes de una interrupción.

Una configuración óptima de las alarmas aborda los siguientes factores:

  • Importancia del recurso.
  • Comportamiento apropiado del recurso. Evalúe el comportamiento de manera individual y en el contexto del ecosistema de servicio. Revise la fluctuación de los valores de las métricas durante un periodo determinado y, a continuación, ajuste los umbrales según sea necesario.
  • Ruido de notificaciones aceptable. Evalúe el método de notificación (por ejemplo, correo electrónico o PagerDuty), los destinatarios adecuados y la frecuencia con la que deben repetirse las notificaciones.

Activar registro de servicio

DevOps Arquitecto, jefe de operaciones en la nube, arquitecto de seguridad

Los logs de servicio son logs que los servicios de Oracle Cloud Infrastructure (OCI) emiten, como API Gateway, eventos, funciones, equilibrio de carga, Object Storage y logs de flujo de VCN. Cada uno de estos servicios soportados tiene un recurso Logs que permite activar o desactivar el registro de ese servicio.

Active el registro de servicio solo si se necesita información de diagnóstico crítica que describa el rendimiento y el acceso a los recursos.

Considere la posibilidad de ingerir logs de servicio con Oracle Cloud Infrastructure Logging Analytics para obtener mejores estadísticas y análisis detallados de patrones y tendencias, según sea necesario.

Crear y mantener políticas de retención de logs.

Activación de Oracle Cloud Infrastructure Ops Insights

Director de operaciones en la nube, arquitecto de seguridad

Oracle Cloud Infrastructure Ops Insights es un servicio nativo de OCI que proporciona una visión integral del uso y la capacidad de los recursos de la base de datos y el host.

Oracle Cloud Infrastructure Ops Insights consta de las siguientes aplicaciones integradas:

  • Planificación de Capacidad
  • Almacén SQL de Oracle

Activación de Oracle Cloud Guard

DevOps Arquitecto, jefe de operaciones en la nube, arquitecto de seguridad

Oracle Cloud Guard es un servicio que ayuda a los clientes a supervisar, identificar, lograr y mantener una estrategia de seguridad sólida en Oracle Cloud. Utilice el servicio para examinar los recursos de Oracle Cloud Infrastructure y detectar deficiencias de seguridad relacionadas con la configuración, así como para revisar los operadores y usuarios y detectar actividades de riesgo.

Asegúrese de que Oracle Cloud Guard está activado en el nivel raíz de su arrendamiento para supervisar todos los compartimentos.

Configurar Auditoría

DevOps Arquitecto, jefe de operaciones en la nube, arquitecto de seguridad

El servicio Oracle Cloud Infrastructure Audit registra automáticamente las llamadas realizadas a todos los puntos finales de la interfaz pública de programación de aplicaciones (API) de Oracle Cloud Infrastructure (OCI) soportados como eventos de log. Actualmente, todos los servicios admiten el registro mediante auditoría.

Revise lo siguiente al configurar la auditoría:

  • Revise la duración de retención de auditoría. El valor por defecto es de 365 días.
  • Si tiene herramientas de terceros que deben acceder a los datos de OCI Audit, configure un conector de servicio para copiar los datos de OCI Audit en Oracle Cloud Infrastructure Object Storage.
  • Asegúrese de que el período de retención del cubo de almacenamiento está configurado correctamente.
  • Considere la posibilidad de ingerir un subjuego de logs de auditoría con OCI Log Analytics para obtener mejores estadísticas y análisis detallados de patrones y tendencias, según sea necesario.