Surveiller votre charge de travail

Comprendre et adopter un processus de surveillance pour tous les services Oracle Cloud Infrastructure. Le service de surveillance utilise des mesures pour surveiller les ressources et les alarmes afin de vous informer lorsque des mesures déclenchent les alarmes spécifiées.

Analyser les mesures d'opération

Architecte de réseau, gestionnaire des opérations en nuage, architecte de la sécurité

Définir, saisir et analyser les mesures opérationnelles pour avoir une meilleure visibilité des événements.

Le service Oracle Cloud Infrastructure Monitoring fournit les informations nécessaires pour comprendre l'état de vos ressources, optimiser la performance de vos applications et répondre aux anomalies en temps réel. Vous pouvez définir des alarmes afin de vous alerter en temps réel des modifications importantes apportées à l'infrastructure et aux services en nuage et ainsi prendre rapidement les mesures appropriées.

Définir les vérifications d'état

Architecte en nuage, gestionnaire des opérations en nuage, architecte de la sécurité

Le service Oracle Cloud Infrastructure Health Checks fournit aux utilisateurs des outils de surveillance externe haute fréquence pour déterminer la disponibilité et la performance de services publics tels que des sites Web hébergés, des points d'extrémité d'API ou des équilibreurs de charge externes.

Utilisez le service Oracle Cloud Infrastructure Health Checks pour vous assurer d'être immédiatement informé de tout problème de disponibilité touchant vos clients.

Surveiller les services de calcul

Gestionnaire des opérations en nuage, architecte de la sécurité

Assurez-vous que l'équipe opérationnelle utilise et applique les mesures des services de calcul.

Utilisez des mesures, des alarmes et des avis pour surveiller les éléments suivants :

  • Instance de calcul : Surveillez l'état, la capacité et la performance de vos instances de calcul.
  • État de l'infrastructure : Surveillez l'état, la capacité et la performance de vos instances sans système d'exploitation de calcul
  • Oracle Cloud Infrastructure Functions : Surveillez l'état, la capacité et la performance des fonctions que vous avez déployées dans Oracle Cloud Infrastructure Functions.
  • État de la base de données : Surveillez l'état, la capacité et la performance des services de base de données. Oracle Cloud Observability and Management Platform offre des capacités unifiées de surveillance et d'administration de base de données pour les bases de données en nuage.
  • État du système d'exploitation : Implémentez des outils de journalisation au niveau du système d'exploitation, tels que auditd.

Surveillez vos réseaux

Architecte de réseau, gestionnaire des opérations en nuage, architecte de la sécurité

Adopter un mécanisme où les mesures sont appliquées à différents points d'extrémité de réseau. Vous pouvez disposer de mesures pour le réseau en nuage virtuel (VCN) interne et pour la connectivité (Oracle Cloud Infrastructure FastConnect et RPV IPsec) ou l'équilibreur de charge.

Utilisez des mesures, des alarmes et des avis pour surveiller les éléments suivants :

  • Mesures liées aux cartes VNIC : Surveillez l'état, la capacité et la performance des cartes VNIC de votre service de réseau (cartes d'interface réseau virtuelles).
  • FastConnect Mesures : Surveillez l'état, la capacité et la performance de la connexion entre votre réseau sur place et votre réseau VCN (connexion Oracle Cloud Infrastructure FastConnect).
  • Mesures de connexion RPV : Surveillez l'état, la capacité et la performance de la connexion entre votre réseau sur place et votre réseau VCN (également appelé RPV IPSec).
  • Mesures liées à la passerelle de service : Surveillez l'état, la capacité et la performance de vos passerelles de service, qui permettent aux hôtes sur place ou aux hôtes VCN d'accéder de manière privée aux services Oracle (tels que le service de stockage d'objets et Autonomous Database) sans exposer les ressources au réseau Internet public.
  • Mesures d'équilibrage de charge : Surveillez l'état, la capacité et la performance de vos équilibreurs de charge, qui servent d'intermédiaire pour le trafic de données entre les clients et vos serveurs d'applications.
  • Équipement local d'abonné : Surveillez l'état, la capacité et la performance de l'équipement frontalier de votre réseau qui se connecte à Oracle Cloud Infrastructure (OCI).
  • Activez les journaux de flux de VCN et ingérez-les avec Oracle Cloud Logging Analytics pour les analyser et identifier des modèles intéressants et obtenir des données clés, au besoin.

Utilisez le Centre de contrôle du réseau OCI et les outils disponibles pour surveiller et observer votre réseau. Le Centre de contrôle du réseau OCI offre les outils d'observabilité suivants pour prendre en charge divers cas d'utilisation d'opérations :

  • Visualiseur de réseau

    Offre une visualisation de topologie intuitive pour comprendre les connexions et les relations entre vos ressources de réseau virtuel, inspecter la configuration à partir d'un seul endroit et résoudre visuellement les problèmes de configuration.

  • Analyseur de chemins réseau

    Permet de dépanner les configurations de réseau virtuel complexes lorsque vous rencontrez des problèmes d'accessibilité. Fournit une analyse de configuration automatisée pour déterminer le chemin réseau emprunté par le trafic, identifier les problèmes de configuration de routage et de sécurité et fournir des informations de configuration le long du chemin.

  • Latence inter-région

    Fournit des informations de latence en temps réel et historiques entre les régions OCI.

  • Journaux de flux de réseau en nuage virtuel

    Offre une télémétrie du trafic réseau, essentielle pour prendre en charge vos cas d'utilisation liés à la sécurité et aux opérations réseau. Vous pouvez obtenir des informations détaillées sur le trafic réseau, diffuser les journaux de flux vers l'outil de votre choix à l'aide de protocoles standard tels que Kafka et archiver les journaux de flux dans le service de stockage d'objets pour OCI à des fins de conformité. Les journaux de flux de VCN peuvent être envoyés à Oracle Cloud Infrastructure Logging Analytics, au stockage d'objets OCI ou à un système de tierce partie.

  • Point d'accès de test virtuel (VTAP)

    Offre des fonctionnalités de mise en miroir du trafic qui permettent la capture complète des paquets pour l'analyse de la sécurité, le dépannage des applications ou des problèmes de performances réseau. Le VTAP est également utile pour résoudre des problèmes réseau complexes en analysant le contenu et les en-têtes des paquets.

Surveiller les données

Architecte en nuage, gestionnaire des opérations en nuage, architecte de la sécurité

Surveillez les services de stockage que vous utilisez pour stocker des données à l'aide de mesures, d'alarmes et d'avis.
  • Mesures de volume par blocs : Surveiller le débit et les opérations des volumes par blocs et des volumes de démarrage.
  • Mesures de stockage d'objets : Surveillez la taille et le nombre d'objets de vos seaux de stockage d'objets.
  • Mesures du système de fichiers : Surveillez l'état, le débit, les demandes et la latence de vos systèmes de fichiers et de vos cibles de montage.

Créer un jeu d'alarmes pour chaque mesure

DevOps Architecte, gestionnaire des opérations infonuagiques, architecte de la sécurité

Créez un jeu d'alarmes pour vos mesures de service pertinentes. Pour chaque mesure émise par des ressources, créez des alarmes qui définissent les comportements des ressources.
  • À risque. La ressource risque de devenir inutilisable, comme indiqué par les valeurs de mesure.
  • Non optimal. Le fonctionnement de la ressource n'est pas optimal, comme indiqué par les valeurs de mesure.
  • Ressource active ou inactive. La ressource est inaccessible ou ne fonctionne pas.

Régler les alertes

DevOps Architecte, gestionnaire des opérations infonuagiques, architecte de la sécurité

Vérifiez les alarmes régulièrement, par exemple toutes les semaines, pour garantir une configuration optimale. Ajustez le seuil, la gravité et les détails des avis de chaque alarme, notamment la méthode, la fréquence et le public ciblé.
Les seuils de mesure trop larges alerteront inutilement, tandis que les seuils trop serrés réduiront le temps nécessaire pour prendre des mesures correctives avant une panne.

Une configuration optimale des alertes tient compte des facteurs suivants :

  • Criticité de la ressource.
  • Comportement approprié de la ressource. Évaluez le comportement individuellement et dans le contexte de l'écosystème du service. Vérifiez les fluctuations des valeurs de mesure pour une période indiquée, puis ajustez les seuils selon les besoins.
  • Niveau de distractions acceptable pour les avis. Évaluez la méthode d'avis (par exemple, courriel ou PagerDuty), les destinataires appropriés et la fréquence des avis renvoyés.

Activer la journalisation de service

DevOps Architecte, gestionnaire des opérations infonuagiques, architecte de la sécurité

Les journaux de service sont émis par les services Oracle Cloud Infrastructure (OCI), tels que les services de passerelle d'API, d'événements, de fonctions, d'équilibrage de charge, de stockage d'objets et les journaux de flux VCN. Chacun de ces services pris en charge comporte une ressource Journaux qui vous permet d'activer ou de désactiver la journalisation pour ce service.

Activez la journalisation des services uniquement si des informations de diagnostic critiques décrivant le rendement des ressources et leur accès sont requises.

Envisagez d'ingérer des journaux de service avec Oracle Cloud Infrastructure Logging Analytics pour une meilleure connaissance et une analyse détaillée des modèles et des tendances, au besoin.

Créer et tenir à jour des politiques de conservation des journaux.

Activer le service Oracle Cloud Infrastructure Ops Insights

Gestionnaire des opérations en nuage, architecte de la sécurité

Oracle Cloud Infrastructure Ops Insights est un service natif OCI qui fournit des informations holistiques sur l'utilisation et la capacité des ressources de base de données et d'hôte.

Le service Oracle Cloud Infrastructure Ops Insights comprend les applications intégrées suivantes :

  • Planification de la capacité
  • Entrepôt Oracle SQL

Activer Oracle Cloud Guard

DevOps Architecte, gestionnaire des opérations infonuagiques, architecte de la sécurité

Oracle Cloud Guard est un service qui aide les clients à surveiller, identifier, atteindre et maintenir un niveau élevé de sécurité dans Oracle Cloud. Utilisez ce service pour rechercher dans vos ressources Oracle Cloud Infrastructure des problèmes de sécurité liés à la configuration, ainsi que des activités risquées effectuées par vos opérateurs et utilisateurs.

Assurez-vous qu'Oracle Cloud Guard est activé au niveau racine de votre location pour surveiller tous vos compartiments.

Configurer la vérification

DevOps Architecte, gestionnaire des opérations infonuagiques, architecte de la sécurité

Le service Oracle Cloud Infrastructure Audit enregistre automatiquement les appels à tous les points d'extrémité d'API publiques d'Oracle Cloud Infrastructure (OCI) pris en charge en tant qu'événements de journal. Actuellement, tous les services prennent en charge la journalisation par le service de vérification.

Vérifiez les éléments suivants lors de la configuration de l'audit :

  • Vérifiez la durée de conservation de la vérification. La valeur par défaut est 365 jours.
  • Si vous disposez d'outils de tierce partie qui doivent accéder aux données de vérification OCI, configurez un connecteur de service pour copier les données de vérification OCI dans Oracle Cloud Infrastructure Object Storage.
  • Assurez-vous que la période de conservation du seau de stockage est configurée correctement.
  • Envisagez d'ingérer un sous-ensemble de journaux de vérification avec OCI Log Analytics pour une meilleure connaissance et une analyse détaillée des modèles et des tendances, au besoin.