Supervisión y observación

La nube ha revolucionado la forma en la que las empresas consumen tecnología. En el pasado, los negocios asumían la propiedad y la responsabilidad de todos los niveles de tecnología, desde la infraestructura hasta el software. En la actualidad, la nube ofrece la posibilidad de que los negocios aprovisionen y consuman los recursos según sea necesario. Aunque las ventajas son un incremento de la eficiencia y la productividad, la nube introduce cambios adicionales en los modelos operativos. Los cambios incluyen:

  • Un modelo de responsabilidad compartida entre el negocio y los proveedores de nube
  • La necesidad de que el negocio mantenga las aplicaciones en las instalaciones locales y en varias nubes
  • Requisitos del equipo de TI para integrar los juegos de herramientas existentes con nuevas herramientas de la plataforma en la nube

Oracle Cloud Infrastructure (OCI) utiliza los mejores procesos operativos de su clase para proteger y supervisar la infraestructura en la nube subyacente, como las instalaciones del centro de datos, el hardware y los sistemas de software. OCI proporciona herramientas que le permiten ejecutar de forma segura sus cargas de trabajo y supervisar sus recursos en la nube, como los recursos informáticos, la red, el almacenamiento, la base de datos y sus aplicaciones completas.

¿Qué es la supervisión y la observación?

La supervisión es una herramienta o un servicio que supervisa el estado de un sistema y dispara una notificación cuando se cumple una condición predefinida.

La observación es una herramienta o una solución que utiliza los datos de telemetría de un sistema, como métricas, logs y rastreos, para depurar un problema y mejorar el rendimiento.

Cómo supervisar los servicios de OCI

OCI ofrece juegos predefinidos de métricas, logs y eventos para proporcionar visibilidad de la infraestructura y los servicios internos. OCI también proporciona integraciones con Grafana, PagerDuty y Slack, además de estándares de soporte de Cloud Native Computing Foundation (CNCF), como CloudEvents y OpenTracing.

Métricas: puede ver una vista completa de las métricas que emiten los servicios de OCI mediante el Explorador de métricas de la consola. Para obtener más información sobre OCI Monitoring y una lista de servicios que emiten métricas, consulte Visión general de Monitoring.

Monitoring le permite definir umbrales en las métricas de recursos para generar alarmas. Las alarmas se pueden incorporar al servicio OCI Notifications. También puede acceder a métricas para la integración con herramientas de terceros que son independientes del proveedor de nube, como Grafana, que es una plataforma de código abierto para la supervisión y el análisis.

Logs: OCI Logging proporciona acceso a logs de recursos de OCI. Los logs incluyen información de diagnóstico crítica que describe el rendimiento de los recursos y cómo se está accediendo a ellos. Para obtener más información, consulte Visión general de Logging.

Eventos: los servicios de OCI emiten eventos. Los eventos son mensajes estructurados que indican un cambio de estado en los recursos de OCI. A continuación se incluyen algunos ejemplos de eventos:

  • Creación de una instancia
  • Supresión de una instancia
  • Creación, actualización o supresión de un recurso

El servicio Notifications puede enrutar los eventos a los canales adecuados. Los eventos también se pueden incorporar a OCI Functions para elementos accionables, como notificar a un equipo específico el inicio de una instancia. Para obtener más información sobre los servicios que emiten eventos, consulte Servicios que generan eventos.

Plataforma de observación y gestión

Los servicios de observación y gestión de OCI están diseñados para superar los desafíos de las aplicaciones y las soluciones modernas que constan de muchos componentes que utilizan diferentes tecnologías. Esta recopilación de servicios proporciona visibilidad y estadísticas de la tecnología tradicional y nativa de la nube, los proveedores de nube y los entornos locales, además de un amplio soporte de ecosistemas basado en estándares. La plataforma está diseñada para ayudarle a gestionar carteras de TI cada vez más diversas y distribuidas, a la vez que reduce el tiempo de resolución de problemas, evitando interrupciones y permitiendo que la TI gestione las aplicaciones desde una perspectiva empresarial. Los servicios incluyen métricas, eventos, logs y mucho más, lo que proporciona flexibilidad en función de sus necesidades de personalización. Los servicios y las funciones son los siguientes:

  • Monitoring: permite a los servicios y clientes de OCI emitir métricas sobre los recursos de clientes de OCI. Las capacidades de Monitoring incluyen las métricas de servicio, un explorador de métricas y el estado y la definición de la alarma. Puede configurar alarmas con umbrales para detectar y responder a anomalías de infraestructura y aplicaciones.

  • Comprobaciones del sistema: proporciona supervisión externa de alta frecuencia para determinar la disponibilidad y el rendimiento de cualquier servicio orientado al público, incluidos los sitios web alojados, los puntos finales de API o los equilibradores de carga externos.

  • Application Performance Monitoring (APM): proporciona una amplia visibilidad del rendimiento de las aplicaciones y permite a los profesionales de DevOps diagnosticar incidencias rápidamente. APM es compatible con OpenTracing y OpenMetrics para el rastreo distribuido y combina la supervisión del usuario final con la supervisión sintética. También puede ingerir telemetría de microservicios desplegados en contenedores de Kubernetes o de Docker.

  • Database Management: proporciona una completa capacidad de gestión y rendimiento de base de datos para cada tipo de instancia de Oracle Database, tanto de OCI como local. Esta capacidad reduce significativamente la carga sobre los administradores de bases de datos ya que proporciona una solución de ciclo de vida completo que incluye supervisión, gestión del rendimiento, ajuste y administración de base de datos.

  • Java Management Service: puede detectar, supervisar y gestionar el entorno Java. Una vez desplegado, el servicio detecta qué versiones de Java tiene en ejecución y dónde, cuáles requieren actualizaciones y qué aplicaciones las utilizan. Este servicio se incluye con su suscripción a Java SE.

  • Logging: proporciona una fácil ingesta de datos de log y análisis para diagnosticar incidencias. Puede integrar Logging con servicios de OCI como Streaming, Monitoring, OCI Functions y Notifications. Logging utiliza el estándar CloudEvents de CNCF y utiliza CNCF Fluentd para ingerir registros de cientos de fuentes.

  • Logging Analytics: solución en la nube basada en aprendizaje automático que supervisa, agrega, indexa y analiza todos los datos de log de sus entornos locales y multinube.

  • Notifications: servicio de publicación y suscripción (pub/sub) de alta disponibilidad y baja latencia que envía alertas y mensajes a OCI Functions, al correo electrónico y a los socios de entrega de mensajes, incluidos Slack y PagerDuty.

  • Operation Insights: herramienta de planificación de capacidad que permite a los administradores descubrir incidencias de rendimiento, prever el consumo y planificar la capacidad mediante análisis basados en aprendizaje automático sobre datos históricos y SQL. Utilice estas capacidades para tomar decisiones basadas en datos a fin de optimizar el uso de recursos, evitar interrupciones de forma proactiva y mejorar el rendimiento.

  • Resource Manager: herramienta de automatización de infraestructura de nube basada en Terraform que proporciona capacidad de servicio de infraestructura como código.

  • Service Connector Hub: ayuda a los ingenieros de la nube a gestionar y mover datos entre servicios de OCI y de OCI a servicios de terceros.

  • Supervisión de pila: permite la supervisión proactiva de las aplicaciones y su pila subyacente, incluidos los servidores de aplicaciones y las bases de datos.

  • Enterprise Manager: proporciona supervisión y gestión completas para Oracle Applications, Middleware, Database y sistemas de ingeniería desplegados en nubes híbridas.

  • Gobernanza: proporciona una completa gama de servicios para ayudarle a optimizar costos, maximizar la utilización y garantizar el cumplimiento de los estándares corporativos y el cumplimiento legislativo para los activos desplegados en OCI.