Surveiller votre charge globale

Comprenez et adoptez un processus de surveillance pour tous les services Oracle Cloud Infrastructure. Le service Monitoring utilise des mesures pour surveiller les ressources et les alarmes afin de vous avertir lorsque les mesures répondent aux critères des déclencheurs spécifiés par l'alarme.

Analyser les mesures d'opération

Architecte réseau, Gestionnaire des opérations cloud, Architecte sécurité

Définir, capturer et analyser des mesures d'opération pour obtenir de la visibilité sur les événements.

Le service Oracle Cloud Infrastructure Monitoring fournit les informations requises pour comprendre l'état général de vos ressources, optimiser les performances de vos applications et réagir aux anomalies en temps réel. Vous pouvez définir des alarmes pour vous alerter en temps réel des changements importants sur l'ensemble de votre infrastructure et de vos services cloud, ce qui vous permet de prendre rapidement les mesures appropriées.

Définition des vérifications de l'état

Architecte cloud, Gestionnaire des opérations cloud, Architecte de sécurité

Le service Oracle Cloud Infrastructure Health Checks offre aux utilisateurs une surveillance externe haute fréquence afin de déterminer la disponibilité et les performances de tout service public, y compris les sites Web hébergés, les adresses d'API ou les équilibreurs de charge externes.

Utilisez Oracle Cloud Infrastructure Health Checks pour vérifier que vous êtes immédiatement au courant de tout problème de disponibilité affectant vos clients.

Surveillance des services de calcul

Responsable des opérations cloud, Architecte de sécurité

Assurez-vous que votre équipe opérationnelle utilise et applique les mesures des services de calcul.

Utilisez des mesures, des alarmes et des notifications pour surveiller les éléments suivants :

  • Instance de calcul : surveillez l'état, la capacité et les performances de vos instances de calcul.
  • Etat de l'infrastructure : surveillance de l'état, de la capacité et des performances de vos instances Bare Metal de calcul
  • Oracle Cloud Infrastructure Functions : surveillez l'état, la capacité et les performances des fonctions que vous avez déployées vers Oracle Cloud Infrastructure Functions.
  • Etat de la base de données : surveillez l'état, la capacité et les performances de vos services de base de données. Oracle Cloud Observability and Management Platform fournit des fonctionnalités unifiées de surveillance et d'administration de base de données pour les bases de données cloud.
  • Intégrité du système d'exploitation : implémentez des outils de journalisation au niveau du système d'exploitation, tels que auditd.

Surveillance de vos réseaux

Architecte réseau, Gestionnaire des opérations cloud, Architecte sécurité

Adoptez un mécanisme dans lequel les mesures sont appliquées à différentes adresses réseau. Vous pouvez disposer de mesures pour le réseau cloud virtuel interne (VCN) ainsi que pour la connectivité (Oracle Cloud Infrastructure FastConnect et VPN IPsec) ou l'équilibreur de charge.

Utilisez des mesures, des alarmes et des notifications pour surveiller les éléments suivants :

  • Mesures de VNIC : surveillez l'état, la capacité et les performances de vos cartes VNIC de service Networking (cartes d'interface réseau virtuelles).
  • Mesures de FastConnect : surveillez l'état, la capacité et les performances de la connexion entre votre réseau sur site et le VCN (connexion Oracle Cloud Infrastructure FastConnect).
  • Mesures de VPN Connect : surveillez l'état, la capacité et les performances de la connexion entre votre réseau sur site et VCN (également appelé VPN IPSec).
  • Mesures de passerelle de service : surveillez l'état, la capacité et les performances de vos passerelles de service, qui permettent aux hôtes sur site ou aux hôtes VCN d'accéder de manière privée aux services Oracle (tels qu'Object Storage et Autonomous Database) sans exposer les ressources sur le réseau Internet public.
  • Mesures d'équilibrage de charge : surveillez l'état, la capacité et les performances de vos équilibreurs de charge, qui servent d'intermédiaire pour le trafic de données entre les clients et vos serveurs d'applications.
  • Equipement sur site client : surveillez l'état, la capacité et les performances de l'équipement frontalier sur votre réseau qui se connecte à Oracle Cloud Infrastructure (OCI).
  • Activez les journaux de flux VCN et ingérez-les avec Oracle Cloud Logging Analytics pour les analyser, identifier des modèles intéressants et obtenir des informations, si nécessaire.

Utilisez le centre de commande réseau OCI et les outils disponibles pour surveiller et observer votre réseau. Le centre de commande réseau OCI offre les outils d'observabilité suivants pour prendre en charge divers cas d'utilisation des opérations :

  • Visualiseur de réseau

    Offre une visualisation de topologie intuitive pour comprendre les connexions et les relations entre les ressources de votre réseau virtuel, inspecter la configuration à partir d'un emplacement unique et résoudre visuellement les problèmes de configuration.

  • Analyseur de chemin réseau

    Vous permet de dépanner des configurations de réseau virtuel complexes en cas de problèmes d'accessibilité. Fournit une analyse de configuration automatisée pour déterminer le chemin réseau emprunté par le trafic, identifier les problèmes de configuration de routage et de sécurité et fournir des informations de configuration le long du chemin.

  • Latence inter-région

    Fournit des informations sur la latence historique et en temps réel entre les régions OCI.

  • Journaux de flux de réseau cloud virtuel

    Offre une télémétrie du trafic réseau, essentielle pour prendre en charge vos cas d'utilisation de sécurité et d'opérations réseau. Vous pouvez obtenir des informations détaillées sur le trafic réseau, diffuser les journaux de flux vers l'outil choisi à l'aide de protocoles standard tels que Kafka et archiver les journaux de flux dans OCI Object Storage à des fins de conformité. Les journaux de flux VCN peuvent être envoyés à Oracle Cloud Infrastructure Logging Analytics, à OCI Object Storage ou à un système tiers.

  • Point d'accès de test virtuel (VTAP)

    Offre des fonctionnalités de mise en miroir du trafic qui permettent la capture complète des paquets pour l'analyse de la sécurité, le dépannage des applications ou les problèmes de performances réseau. Le point d'accès de test virtuel est également utile pour résoudre les problèmes réseau complexes en analysant le contenu et les en-têtes des paquets.

Données de surveillance

Architecte cloud, Gestionnaire des opérations cloud, Architecte de sécurité

Surveillez les services de stockage que vous utilisez pour stocker des données à l'aide de mesures, d'alarmes et de notifications.
  • Mesures de volume de blocs : surveillez le débit et les opérations des volumes de blocs et des volumes d'initialisation.
  • Mesures d'Object Storage : surveillez la taille et le nombre d'objets de vos buckets Object Storage.
  • Mesures de système de fichiers : surveillez l'état, le débit, les demandes et la latence de vos systèmes de fichiers et cibles de montage.

Création d'un ensemble d'alarmes pour chaque mesure

DevOps Architecte, Gestionnaire des opérations cloud, Architecte de sécurité

Créez un ensemble d'alarmes pour les mesures de service pertinentes. Pour chaque mesure émise par vos ressources, créez des alarmes définissant les comportements de ces dernières.
  • à risque. La ressource risque de devenir inutilisable, comme indiqué par les valeurs de mesure.
  • Non optimal. La ressource présente des niveaux de performances non optimaux, comme indiqué par les valeurs de mesure.
  • La ressource est active ou inactive. La ressource est inaccessible ou ne fonctionne pas.

Réglage des alarmes

DevOps Architecte, Gestionnaire des opérations cloud, Architecte de sécurité

Vérifiez régulièrement vos alarmes, par exemple toutes les semaines, pour assurer une configuration optimale. Etalonnez les détails de seuil, de gravité et de notification de chaque alarme, y compris la méthode, la fréquence et les personnes ciblées.
Les seuils de mesure trop larges génèrent une alerte inutile, tandis que les seuils trop serrés réduisent le temps nécessaire pour prendre des mesures correctives avant une coupure.

Une configuration optimale des alarmes prend en compte les facteurs suivants :

  • Niveau d'importance de la ressource.
  • Comportement approprié des ressources. Evaluez le comportement individuellement et dans le contexte de l'écosystème du service. Vérifiez les fluctuations des valeurs de mesure sur une période donnée, puis ajustez les seuils selon les besoins.
  • Bruit de notification acceptable. Evaluez la méthode de notification (par exemple, courriel ou PagerDuty), les destinataires appropriés et la fréquence de répétition des notifications.

Activer la journalisation de service

DevOps Architecte, Gestionnaire des opérations cloud, Architecte de sécurité

Les journaux de service sont des journaux émis par les services Oracle Cloud Infrastructure (OCI), tels que API Gateway, Events, Functions, Load Balancing, Object Storage et les journaux de flux VCN. Chacun de ces services pris en charge dispose d'une ressource de journaux qui vous permet d'activer ou de désactiver la journalisation pour le service en question.

Activez la journalisation des services uniquement si des informations de diagnostic critiques décrivant les performances et l'accès aux ressources sont requises.

Envisagez d'assimiler les journaux de service avec Oracle Cloud Infrastructure Logging Analytics pour obtenir de meilleures informations et une analyse détaillée des modèles et des tendances, si nécessaire.

Créer et tenir à jour des stratégies de conservation de journal.

Activation d'Oracle Cloud Infrastructure Ops Insights

Responsable des opérations cloud, Architecte de sécurité

Oracle Cloud Infrastructure Ops Insights est un service natif OCI qui fournit des informations globales sur la capacité et l'utilisation des ressources de base de données et d'hôte.

Oracle Cloud Infrastructure Ops Insights est composé des applications intégrées suivantes :

  • Planification de capacité
  • Oracle SQL Warehouse

Activer Oracle Cloud Guard

DevOps Architecte, Gestionnaire des opérations cloud, Architecte de sécurité

Oracle Cloud Guard est un service qui aide les clients à surveiller, à identifier, à atteindre et à maintenir un état de sécurité élevé sur Oracle Cloud. Utilisez le service pour examiner les failles de sécurité de vos ressources Oracle Cloud Infrastructure liées à la configuration, ainsi que les activités à risque de vos opérateurs et utilisateurs.

Assurez-vous qu'Oracle Cloud Guard est activé au niveau racine de votre location pour surveiller tous vos compartiments.

Configurer un audit

DevOps Architecte, Gestionnaire des opérations cloud, Architecte de sécurité

Le service Oracle Cloud Infrastructure Audit enregistre automatiquement les appels vers toutes les adresses d'API publiques Oracle Cloud Infrastructure (OCI) prises en charge en tant qu'événements de journal. Actuellement, tous les services prennent en charge la journalisation par Audit.

Vérifiez les points suivants lors de la configuration de l'audit :

  • Vérifiez la durée de conservation de l'audit. La valeur par défaut est de 365 jours.
  • Si vous disposez d'outils tiers qui doivent accéder aux données OCI Audit, configurez un connecteur de service pour copier les données OCI Audit vers Oracle Cloud Infrastructure Object Storage.
  • Assurez-vous que la période de conservation sur le bucket de stockage est correctement configurée.
  • Envisagez d'inclure un sous-ensemble de journaux d'audit avec OCI Log Analytics pour obtenir de meilleures informations et une analyse détaillée des modèles et des tendances, si nécessaire.