ワークロードの監視

すべてのOracle Cloud Infrastructureサービスの監視プロセスを理解し、採用します。モニタリング・サービスは、メトリックを使用してリソースおよびアラームをモニターし、メトリックがアラーム指定のトリガーを満たしたときに通知します。

操作メトリックの分析

セキュリティ・アーキテクト、クラウド・オペレーション・マネージャー、ネットワーク・アーキテクト

運用メトリックを定義、取得および分析して、イベントを表示できます。

Oracle Cloud Infrastructure Monitoringサービスは、リソースの健全性を理解し、アプリケーション・パフォーマンスを最適化して、リアルタイムで異常に対応するために必要なインサイトを提供します。アラームを設定して、クラウド・インフラストラクチャやサービス全体の重要な変更をリアルタイムで警告できるため、適切なアクションをすばやく実行できます。

ヘルス・チェックの定義

セキュリティ・アーキテクト、クラウド・オペレーション・マネージャー、クラウド・アーキテクト

Oracle Cloud Infrastructure Health Checksサービスは、ホストWebサイト、APIエンドポイント、外部向けロード・バランサなど、公開サービスの可用性とパフォーマンスを判断するための高頻度の外部モニタリングをユーザーに提供します。

Oracle Cloud Infrastructure Health Checksを使用して、顧客に影響がある可用性の問題をすぐに認識できるようにします。

Compute Servicesの監視

セキュリティ・アーキテクト、クラウド・オペレーション・マネージャー

運用チームがコンピュート・サービス・メトリックを使用および適用していることを確認します。

メトリック、アラームおよび通知を使用して、次のものをモニターします。

  • コンピュート・インスタンス: コンピュート・インスタンスのヘルス、容量およびパフォーマンスをモニターします。
  • インフラストラクチャの状態: コンピュート・ベア・メタル・インスタンスの状態、容量およびパフォーマンスを監視します
  • Oracle Cloud Infrastructure Functions: Oracle Cloud Infrastructure Functionsにデプロイしたファンクションのヘルス、容量およびパフォーマンスを監視します。
  • データベース・ヘルス: データベース・サービスのヘルス、容量およびパフォーマンスを監視します。Oracle Cloud Observability and Management Platformは、クラウド・データベースの統合的なデータベース監視および管理機能を提供します。
  • オペレーティング・システムのヘルス: auditdなどのOSレベルのロギング・ツールを実装します。

ネットワークの監視

セキュリティ・アーキテクト、クラウド・オペレーション・マネージャー、ネットワーク・アーキテクト

メトリックが様々なネットワーク・エンドポイントで適用されるメカニズムを採用します。内部仮想クラウド・ネットワーク(VCN)のメトリックと、接続(Oracle Cloud Infrastructure FastConnectおよびIPsec VPN)またはロード・バランサのメトリックを設定できます。

メトリック、アラームおよび通知を使用して、次のものをモニターします。

  • VNICメトリック: ネットワーキング・サービスVNIC (仮想ネットワーク・インタフェース・カード)のヘルス、容量およびパフォーマンスをモニターします。
  • FastConnectメトリック: オンプレミス・ネットワークとVCN (Oracle Cloud Infrastructure FastConnect接続)間の接続のヘルス、容量およびパフォーマンスをモニターします。
  • VPN接続メトリック: オンプレミス・ネットワークとVCN (IPSec VPNとも呼ばれる)間の接続のヘルス、容量およびパフォーマンスをモニターします。
  • サービス・ゲートウェイ・メトリック: サービス・ゲートウェイのヘルス、容量およびパフォーマンスをモニターします。これにより、オンプレミス・ホストまたはVCNホストは、パブリック・インターネットにリソースを公開せずに、Oracleサービス(オブジェクト・ストレージやAutonomous Databaseなど)にプライベート・アクセスできます。
  • ロード・バランシング・メトリック: クライアントとアプリケーション・サーバー間のデータ・トラフィックの仲介として機能するロード・バランサのヘルス、容量およびパフォーマンスをモニターします。
  • 顧客構内機器: Oracle Cloud Infrastructure (OCI)に接続するネットワーク上の境界機器の状態、容量およびパフォーマンスを監視します。
  • VCN Flowログを有効にし、Oracle Cloud Logging Analyticsで取り込み、それらを分析し、興味深いパターンを特定し、必要に応じてインサイトを獲得します。

OCIネットワーク・コマンド・センターおよび使用可能なツールを使用して、ネットワークを監視および監視します。OCI Network Command Centerには、様々な操作ユースケースをサポートする次の可観測性ツールが用意されています。

  • ネットワーク・ビジュアライザ

    仮想ネットワーク・リソース間の接続および関係を理解し、構成を1箇所から検査し、構成の問題を視覚的にトラブルシューティングするための直感的なトポロジ・ビジュアライゼーションを提供します。

  • ネットワーク・パス・アナライザ

    到達可能性の問題がある場合に、複雑な仮想ネットワーク構成をトラブルシューティングできます。トラフィックのネットワークパスを特定し、ルーティングとセキュリティー構成の問題を特定し、パスに沿った構成情報を提供するための自動構成分析を提供します。

  • リージョン間のレイテンシ

    OCIリージョン間のリアルタイムおよび履歴レイテンシ情報を提供します。

  • VCNフロー・ログ

    セキュリティおよびネットワーク運用のユース・ケースをサポートするために不可欠な、ネットワーク・トラフィックのテレメトリを提供します。ネットワークトラフィックに関する豊富なインサイトを取得し、Kafkaなどの標準プロトコルを使用して選択したツールにフローログをストリーミングし、コンプライアンスの目的でOCI Object Storageにフローログをアーカイブできます。VCNフロー・ログは、Oracle Cloud Infrastructure Logging AnalyticsOCI Object Storageまたはサードパーティ・システムに送信できます。

  • 仮想テスト・アクセス・ポイント(VTAP)

    セキュリティ分析、アプリケーションのトラブルシューティング、またはネットワーク・パフォーマンスの問題に対してフル・パケット・キャプチャを可能にするトラフィック・ミラーリング機能を提供します。VTAPは、パケットの内容とヘッダーを分析することによって複雑なネットワークの問題のトラブルシューティングにも役立ちます。

データのモニター

Cloud Architect、Cloud Operations Manager、Security Architect

メトリック、アラームおよび通知を使用して、データの格納に使用するストレージ・サービスを監視します。
  • Block Volumeメトリック: ブロック・ボリュームおよびブート・ボリュームのスループットと操作を監視します。
  • オブジェクト・ストレージ・メトリック: オブジェクト・ストレージ・バケットのオブジェクトのサイズと数を監視します。
  • ファイル・システム・メトリック: ファイル・システムおよびマウント・ターゲットのヘルス、スループット、リクエストおよびレイテンシを監視します。

各メトリックの一連のアラームの作成

DevOps Architect、Cloud Operations Manager、Security Architect

関連するサービス・メトリックのアラームのセットを作成します。リソースにより発行される各メトリックに対して、リソース動作を定義するアラームを作成します。
  • リスク状態リソースは、メトリック値で示されるように、動作しなくなるリスクがあります。
  • 非最適。リソースは、メトリック値で示されるように、非最適レベルで実行しています。
  • リソースが稼働中または停止。リソースにアクセスできないか、または操作ができません。

アラームのチューニング

DevOps Architect、Cloud Operations Manager、Security Architect

最適な構成になるように、毎週など、定期的にアラームを確認してください。各アラームのしきい値、重大度および通知の詳細(方法、頻度、ターゲット対象者など)を調整します。
メトリックのしきい値が大きすぎると、不必要に警告されますが、しきい値が小さすぎると、停止前に修正処理を行う時間が短縮されます。

最適なアラーム構成は、次の要因に対処します。

  • リソースのクリティカル度。
  • 適切なリソースの動作。サービス・エコシステムのコンテキスト内で、動作を個別に評価します。特定の期間のメトリック値の変動を確認し、必要に応じてしきい値を調整します。
  • 許容可能な通知ノイズ。通知方法(電子メールやPagerDuty)、適切な受信者、繰返し通知の頻度を評価します。

サービス・ロギングの有効化

DevOps Architect、Cloud Operations Manager、Security Architect

サービス・ログは、Oracle Cloud Infrastructure (OCI)サービス(APIゲートウェイ、イベント、ファンクション、ロード・バランシング、オブジェクト・ストレージ、VCNフロー・ログなどの)によって発行されるログです。これらのサポートされる各サービスには、そのサービスのロギングを有効または無効にできるログ・リソースがあります。

リソースのパフォーマンスおよびアクセス方法を説明するクリティカルな診断情報が必要な場合にのみ、サービス・ロギングを有効にします。

必要に応じて、パターンと傾向をより的確に把握し、詳細な分析を行うために、Oracle Cloud Infrastructure Logging Analyticsでサービス・ログを取り込むことを検討してください。

ログ保持ポリシーを作成および保守します。

Oracle Cloud Infrastructure Ops Insightsの有効化

セキュリティ・アーキテクト、クラウド・オペレーション・マネージャー

Oracle Cloud Infrastructure Ops Insightsは、データベースおよびホストのリソース使用率および容量に関する包括的なインサイトを提供するOCIネイティブ・サービスです。

Oracle Cloud Infrastructure Ops Insightsは、次の統合アプリケーションで構成されます:

  • 容量計画
  • Oracle SQL Warehouse

Oracle Cloud Guardの有効化

DevOps Architect、Cloud Operations Manager、Security Architect

Oracle Cloud Guardは、顧客がOracle Cloudでの強力なセキュリティ・ポスチャをモニター、識別、実現および維持するのに役立つサービスです。このサービスを使用して、構成に関連するセキュリティの弱点がOracle Cloud Infrastructureリソースにないかと、リスクのあるアクティビティがオペレータおよびユーザーにないかを調べます。

テナンシのルート・レベルでOracle Cloud Guardが有効になっていることを確認し、すべてのコンパートメントを監視します。

監査の構成

DevOps Architect、Cloud Operations Manager、Security Architect

Oracle Cloud Infrastructure Auditサービスでは、ログ・イベントとして、サポートされているすべてのOracle Cloud Infrastructure (OCI)パブリック・アプリケーション・プログラミング・インタフェース(API)エンドポイントへのコールが自動的に記録されます。現在、すべてのサービスが監査によるロギングをサポートしています。

監査を構成する場合は、次を確認します。

  • 監査保持期間をレビューします。デフォルトは365日に設定されています。
  • OCI Auditデータにアクセスする必要があるサード・パーティ・ツールがある場合は、OCI AuditデータをOracle Cloud Infrastructure Object Storageにコピーするようにサービス・コネクタを構成します。
  • ストレージ・バケットの保持期間が適切に構成されていることを確認します。
  • 必要に応じて、OCI Log Analyticsを使用して監査ログのサブセットを取り込むことを検討し、パターンと傾向をより的確に把握し、詳細な分析を行うことを検討してください。