Surveillance et observation
Le cloud a révolutionné la façon dont les entreprises utilisent les technologies. Par le passé, les entreprises assumaient la propriété et la responsabilité de tous les niveaux de technologie, de l'infrastructure aux logiciels. Désormais, le cloud offre aux entreprises la possibilité de provisionner et d'utiliser des ressources en fonction de leurs besoins. Si le cloud présente l'avantage d'accroître l'efficacité et la productivité, il introduit également des changements dans les modèles opérationnels. Exemples de changement :
- Modèle de responsabilité partagée entre l'entreprise et les fournisseurs de cloud
- Nécessité pour l'entreprise de gérer des applications sur site et dans plusieurs clouds
- Exigences de l'équipe informatique relatives à l'intégration des outils existants aux nouveaux outils de plate-forme cloud
Oracle Cloud Infrastructure (OCI) utilise des processus opérationnels de pointe pour sécuriser et surveiller l'infrastructure cloud sous-jacente, comme les installations de centre de données, le matériel et les systèmes logiciels. OCI fournit des outils qui vous permettent d'exécuter en toute sécurité vos charges globales et de surveiller vos ressources cloud, telles que celles en lien avec le calcul, le réseau, le stockage, les bases de données et les applications de bout en bout correspondantes.
Présentation de la surveillance et de l'observation
La surveillance désigne un outil ou un service qui surveille l'état d'un système et déclenche une notification lorsqu'une condition prédéfinie est remplie.
L'observation désigne un outil ou une solution qui utilise les données de télémétrie d'un système, telles que les mesures, les journaux et les traces, pour déboguer un problème et améliorer les performances.
Surveillance des services OCI
OCI propose des ensembles prédéfinis de mesures, de journaux et d'événements pour offrir une visibilité sur l'infrastructure et les services internes. OCI fournit également des intégrations à Grafana, PagerDuty et Slack, en plus de prendre en charge les normes de la CNCF (Cloud Native Computing Foundation), telles que CloudEvents et OpenTracing.
Mesures : vous pouvez accéder à une vue complète des mesures émises par les services OCI à l'aide de l'explorateur de mesures dans la console. Pour obtenir plus d'informations sur OCI Monitoring et la liste des services qui émettent des mesures, reportez-vous à Présentation de Monitoring.
Monitoring vous permet de définir des seuils pour les mesures de ressource afin de générer des alarmes. Les alarmes peuvent alimenter le service OCI Notifications. Vous pouvez également accéder aux mesures pour l'intégration à des outils tiers compatibles avec des fournisseurs de cloud, tels que Grafana, qui est une plate-forme open source de surveillance et d'analyse.
Journaux : OCI Logging permet d'accéder aux journaux à partir des ressources OCI. Les journaux contiennent des informations de diagnostic critiques qui décrivent les modalités d'accès aux ressources et leurs performances. Pour plus d'informations, reportez-vous à Présentation de Logging.
Evénements : les services OCI émettent des événements. Les événements sont des messages structurés indiquant une modification d'état dans les ressources OCI. Quelques exemples d'événement :
- Création d'une instance
- Suppression d'une instance
- Création, mise à jour ou suppression d'une ressource
Les événements peuvent être acheminés par le service Notifications vers les canaux appropriés. Les événements peuvent également alimenter OCI Functions en cas d'élément exploitable, par exemple pour informer une équipe spécifique du lancement d'une instance. Pour plus d'informations sur les services qui émettent des événements, reportez-vous à Services produisant des événements.
Observability and Management Platform
Les services d'observation et de gestion d'OCI sont conçus pour répondre aux défis des applications et des solutions modernes comprenant de nombreux composants qui utilisent diverses technologies. Cet ensemble de services offre visibilité et informations sur les technologies traditionnelles et natives cloud, les fournisseurs de cloud et les environnements sur site, en plus d'une vaste prise en charge des écosystèmes basés sur des normes. La plate-forme est conçue pour vous aider à gérer des portefeuilles informatiques de plus en plus diversifiés et distribués, tout en réduisant le temps de dépannage, en évitant les pannes et en permettant aux services informatiques de gérer les applications sous l'angle commercial. Les services incluent des mesures, des événements, des journaux et bien plus encore, offrant ainsi une flexibilité en fonction de vos besoins de personnalisation. Les services et fonctionnalités sont les suivants :
Monitoring : permet aux clients et aux services OCI d'émettre des mesures relatives aux ressources client OCI. Les fonctionnalités de surveillance incluent les mesures de service, l'explorateur de mesures, ainsi que le statut et la définition des alarmes. Vous pouvez configurer des alarmes avec des seuils pour détecter les anomalies d'infrastructure et d'application et y répondre.
Health Checks : offre une surveillance externe haute fréquence permettant de déterminer la disponibilité et les performances de tout service public, y compris les sites Web hébergés, les adresses d'API ou les équilibreurs de charge externes.
Application Performance Monitoring (APM) : offre une visibilité étendue sur les performances des applications et permet aux professionnels DevOps de diagnostiquer rapidement les problèmes. APM est compatible avec OpenTracing et OpenMetrics pour la trace distribuée, et combine la surveillance de l'utilisateur final avec la surveillance synthétique. Ce service peut également inclure la télémétrie de microservices déployés dans des conteneurs Kubernetes ou Docker.
Database Management : offre des fonctionnalités complètes relatives à la gestion et aux performances des bases de données pour chaque type de base de données Oracle, y compris OCI et sur site. Cette fonctionnalité réduit considérablement la charge des administrateurs de base de données en fournissant une solution de cycle de vie complet englobant la surveillance, la gestion des performances, le réglage et l'administration de base de données.
Java Management Service : permet de repérer, de surveiller et de gérer l'environnement Java. Une fois déployé, le service repère les versions de Java que vous exécutez et où, celles qui nécessitent des mises à jour et les applications qui les utilisent. Ce service est inclus dans l'abonnement Java SE.
Logging : permet d'inclure facilement les données et les analyses des journaux pour diagnostiquer les problèmes. Vous pouvez intégrer Logging aux services OCI tels que Streaming, Monitoring, OCI Functions et Notifications. Logging utilise la norme CloudEvents et le projet Fluentd de la CNCF pour inclure des journaux provenant de centaines de sources.
Logging Analytics : solution cloud basée sur l'apprentissage automatique qui surveille, agrège, indexe et analyse toutes les données des journaux des environnements sur site et multiclouds.
Notifications : service de publication et d'abonnement hautement disponible à faible latence qui envoie des alertes et des messages à OCI Functions, ainsi qu'aux partenaires de distribution de messages et de courriels, y compris Slack et PagerDuty.
Operation Insights : outil de planification de la capacité qui permet aux administrateurs de détecter les problèmes de performances, de prévoir la consommation et de planifier la capacité à l'aide d'analyses de données historiques et SQL qui reposent sur l'apprentissage automatique. Utilisez ces fonctionnalités pour prendre des décisions orientées données afin d'optimiser l'utilisation des ressources, d'éviter les coupures de manière proactive et d'améliorer les performances.
Resource Manager : outil d'automatisation de l'infrastructure cloud reposant sur Terraform qui fournit des fonctionnalités de service Infrastructure-as-Code.
Service Connector Hub : aide les ingénieurs cloud à gérer et à déplacer des données entre les services OCI, et d'OCI vers des services tiers.
Stack Monitoring : permet une surveillance proactive des applications et de leur pile sous-jacente, y compris les serveurs d'applications et les bases de données.
Enterprise Manager : fournit une surveillance et une gestion complètes pour les applications Oracle, le middleware, les bases de données et les systèmes intégrés déployés dans des clouds hybrides.
Gouvernance : fournit une gamme complète de services pour vous aider à optimiser les coûts, à maximiser l'utilisation et à garantir la conformité des ressources déployées dans OCI avec les normes d'entreprise et la législation.