モニタリングと監視
クラウドは、ビジネスがテクノロジを消費する方法に革命をもたらしました。以前は、インフラストラクチャからソフトウェアに至るまで、あらゆるレベルのテクノロジの所有と責任をビジネスが引き受けていました。現在では、クラウドにより、ビジネスは必要に応じてリソースをプロビジョニングおよび消費できるようになっています。クラウドには効率と生産性の向上というメリットがありますが、運用モデルに追加の変更が加えられます。含まれる変更:
- ビジネスとクラウド・プロバイダ間の共有責任モデル
- ビジネスがオンプレミスと複数のクラウドでアプリケーションを保守する必要がある
- ITチームが既存のツールセットを新しいクラウド・プラットフォーム・ツールと統合する必要がある
Oracle Cloud Infrastructure(OCI)は、最高クラスの運用プロセスを使用して、データ・センター設備、ハードウェア、ソフトウェア・システムなど、基盤となるクラウド・インフラストラクチャを保護およびモニターします。OCIには、ワークロードを安全に実行し、コンピュート、ネットワーク、ストレージ、データベース、エンドツーエンド・アプリケーションなどのクラウド・リソースをモニターできるツールが用意されています。
モニタリングと監視とは
モニタリングは、システムの状態を監視し、事前定義済の条件が満たされたときに通知をトリガーするツールまたはサービスです。
監視は、メトリック、ログ、トレースなどのシステムのテレメトリ・データを使用して問題をデバッグし、パフォーマンスを向上させるツールまたはソリューションです。
OCIサービスをモニターする方法
OCIでは、メトリック、ログおよびイベントの事前定義済セットを使用して、内部のインフラストラクチャおよびサービスを可視化できます。また、OCIでは、Cloud Native Computing Foundation (CNCF)のサポート標準(CloudEventsやOpenTracingなど)に加えて、Grafana、PagerDutyおよびSlackとの統合も提供しています。
メトリック: コンソールでメトリック・エクスプローラを使用して、OCIサービスによって発行されたメトリックを包括的に表示できます。OCIモニタリングの詳細、およびメトリックを発行するサービスのリストについては、モニタリングの概要を参照してください。
モニタリングを使用すると、リソース・メトリックにアラームを生成するためのしきい値を定義できます。アラームはOCI Notificationsサービスにフィードできます。また、モニタリングおよび分析用のオープン・ソース・プラットフォームであるGrafanaなど、クラウド・ベンダーに依存しないサードパーティ・ツールとの統合のためのメトリックにアクセスすることもできます。
ログ: OCI Loggingでは、OCIリソースからログにアクセスできます。ログには、リソースのパフォーマンスやアクセス状況を示すクリティカルな診断情報が含まれます。詳細は、ロギングの概要を参照してください。
イベント: OCIサービスはイベントを発行します。イベントは、OCIリソースの状態変更を示す構造化メッセージです。イベントの例:
- インスタンスの作成
- インスタンスの削除
- リソースの作成、更新または削除
イベントは、通知サービスによって適切なチャネルにルーティングできます。また、インスタンスの起動について特定のチームに通知するなど、実行可能なアイテムについてイベントをOCI Functionsにフィードすることもできます。イベントを発行するサービスの詳細は、イベントを生成するサービスを参照してください。
監視および管理プラットフォーム
OCIの監視および管理サービスは、様々なテクノロジを使用する多くのコンポーネントで構成された最新のアプリケーションおよびソリューションの課題に対応できるように設計されています。これらのサービスが集まって、広範な標準ベースのエコシステム・サポートに加えて、クラウド・ネイティブ・テクノロジと従来のテクノロジ、クラウド・プロバイダおよびオンプレミス環境にわたる可視性とインサイトを提供します。このプラットフォームは、トラブルシューティング時間を短縮し、停止を回避し、IT部門がビジネスの観点からアプリケーションを管理できるようにしつつ、一方でますます多様化する分散型ITポートフォリオを管理できるように設計されています。サービスにはメトリック、イベント、ログなどが含まれており、さらに、カスタマイズの必要性に対応できる柔軟性を備えています。含まれるサービスおよび機能:
モニタリング: OCIサービスおよび顧客はOCIの顧客リソースに関するメトリックを発行できます。モニタリング機能には、サービス・メトリック、メトリック・エクスプローラ、アラームのステータスおよび定義が含まれます。しきい値を使用してアラームを構成することで、インフラストラクチャおよびアプリケーションの異常を検出してそれに対応できます。
ヘルス・チェック: ホストされたWebサイト、APIエンドポイント、外部向けロード・バランサなど、一般公開されたサービスの可用性およびパフォーマンスを判断するための高頻度の外部モニタリングを提供します。
Application Performance Monitoring (APM): アプリケーションのパフォーマンスを詳細に可視化し、DevOpsの専門家が問題を迅速に診断できるようにします。APMは、分散トレース用のOpenTracingおよびOpenMetricsと互換性があり、エンド・ユーザー・モニタリングを合成モニタリングと組み合せます。また、KubernetesまたはDockerコンテナにデプロイされたマイクロサービスからテレメトリを取り込むこともできます。
データベース管理: OCIやオンプレミスなど、各タイプのOracle Databaseに対する包括的なデータベース・パフォーマンスおよび管理機能を提供します。この機能によって、モニタリング、パフォーマンス管理、チューニングおよびデータベース管理を含む全ライフサイクル・ソリューションが提供されるため、データベース管理者の負担が大幅に軽減されます。
Java Management Service: Java環境を検出、モニターおよび管理できます。デプロイすると、サービスによって、実行されているJavaのバージョンと場所、更新が必要なバージョン、およびそれらを使用しているアプリケーションが検出されます。このサービスは、Java SE Subscriptionに含まれています。
ロギング: 問題を診断するために、ログ・データと分析を簡単に取り込むことができます。ロギングは、ストリーミング、モニタリング、OCI Functions、通知などのOCIサービスと統合できます。ロギングでは、CNCFのCloudEvents標準を使用し、CNCF Fluentdを使用して数百ものソースからログを取り込みます。
ログ・アナリティクス: オンプレミスおよびマルチクラウド環境からのすべてのログ・データをモニター、集計、索引付けおよび分析する、機械学習ベースのクラウド・ソリューション。
通知: アラートおよびメッセージをOCI Functions、電子メールおよびメッセージ配信パートナ(Slack、PagerDutyなど)に送信する、高可用性かつ低レイテンシのパブリッシュ/サブスクライブ・サービス。
オペレーション・インサイト: 履歴データおよびSQLデータに関する機械学習ベースの分析を使用して、管理者がパフォーマンスの問題を明らかにし、消費を予測し、容量を計画できるようにする容量計画ツール。これらの機能を使用して、データ主導の意思決定を行うことで、リソースの使用を最適化し、停止をプロアクティブに回避し、パフォーマンスを向上させます。
リソース・マネージャ: infrastructure-as-codeサービス機能を提供するTerraformベースのクラウド・インフラストラクチャ自動化ツール。
サービス・コネクタ・ハブ: クラウド・エンジニアがOCIのデータを管理し、異なるOCIサービス間およびOCIからサードパーティ・サービスにデータを移動する際に役立ちます。
スタック監視:アプリケーション・サーバーやデータベースなど、アプリケーションとその基礎となるスタックをプロアクティブに監視できます。
Enterprise Manager: ハイブリッド・クラウドにデプロイされたOracle Applications、ミドルウェア、データベースおよびエンジニアド・システムの包括的なモニタリングおよび管理を提供します。
ガバナンス: コストの最適化、利用率の最大化、OCIにデプロイされたアセットに対する企業標準および法規制コンプライアンスの遵守に役立つ包括的なサービスを提供します。