Grafanaでのモニタリング・データの表示および解釈

Private Cloud Applianceのインフラストラクチャ・サービス・レイヤーは、プラットフォーム上に構築され、すべてのクラウド・ユーザーおよび管理者機能を有効にし、Grafanaダッシュボードの広範なコレクションを通じて監視できます。

これらのマイクロサービスは、Kubernetesコンテナの3つの管理ノードにデプロイされるため、その監視は主にKubernetesノードとポッド・メトリックに基づきます。Kubernetesクラスタはコンピュート・ノードにも拡張され、Kubernetesワーカー・ノードはシステムの運用と監視のために重要な追加データを収集します。

この項で説明するダッシュボードは、マイクロサービスのヘルス・モニタリングの開始点として適しています。かわりに、様々なダッシュボード、メトリックおよびビジュアライゼーションを使用することをお薦めします。システム全体にわたって収集される必要なデータはPrometheusに格納され、Grafanaを介して様々な方法で照会および表示できます。


Grafanaフォルダ	ダッシュボード	摘要
サービスのモニタリング	ClusterLabs HAクラスタの詳細	このダッシュボードでは、Pacemakerに基づいてHAクラスタのデータを表示するために、特注のPrometheusエクスポータを使用します。各HTTPリクエストで、クラスタ・コンポーネントのツールによって提供される既存の分散データを解析することによって、クラスタ・ステータスをローカルに検査します。モニタリングデータには、Pacemakerクラスタのサマリー、ノードとリソースの統計、およびCorosyncリングエラーと定足数投票が含まれます。
サービスのモニタリング	MySQL Clusterエクスポータ	このダッシュボードには、MySQLデータベース・クラスタのパフォーマンス詳細が表示されます。データには、稼働時間、接続統計、表のロック数などのデータベース・サービス・メトリックに加え、MySQLオブジェクト、接続、ネットワーク・トラフィック、メモリーおよびCPU使用率に関するより一般的な情報が含まれます。
サービスのモニタリング	サービス・レベル	このダッシュボードには、基本的なアプライアンス・サービスによって受信されるRabbitMQリクエストに関する詳細情報が表示されます。これにより、リクエストの数、リクエストの待機時間、およびエラーの原因となったリクエストを監視できます。
サービスのモニタリング	VM統計	この包括的なダッシュボードには、ご使用の環境のコンピュート・インスタンス全体のリソース消費情報が表示されます。これには、CPUおよびメモリーの使用率、ディスク・アクティビティ、ネットワーク・トラフィックなどのグラフが含まれます。このダッシュボードのパネルには、1つのグラフに多数の時系列が表示されます。クリックすると1つの時系列を表示したり、グラフの上にカーソルを置くと、時間軸上の特定のポイントで詳細データを表示できます。
PCA 3.0サービス・アドバイザ	Kubeエンドポイント	このダッシュボードは、Kubernetesエンドポイントに特に重点を置いており、エンドポイント・アラートを提供します。これらのアラートは、選択した通知チャネルに送信できます。
PCA 3.0サービス・アドバイザ	Kube Ingress	このダッシュボードは、Kubernetesサービスとそのポッドへのイングレス・トラフィックに関するデータを提供します。2つのアラートが組み込まれており、選択した通知チャネルに送信できます。
PCA 3.0サービス・アドバイザ	Kubeノード	このダッシュボードには、Kubernetesクラスタおよびホスト・マイクロサービス・ポッドに属するすべてのサーバー・ノードのメトリック・データ(つまり、管理およびコンピュート・ノード)が表示されます。ポッド数、CPUおよびメモリー使用量などを監視できます。メトリック・パネルには、すべてのノードの情報が表示されます。グラフベースのパネルでは、クリックして単一ノードの情報を表示できます。
PCA 3.0サービス・アドバイザ	Kube Pod	このダッシュボードには、マイクロサービス・ポッドのレベルでメトリック・データが表示され、ポッド全体の合計数およびノード間でのポッドの分散方法を表示できます。ネームスペースおよびサービスごとにステータスをモニターし、アラートがトリガーされたかどうかを確認できます。
PCA 3.0サービス・アドバイザ	Kubeサービス	このダッシュボードには、Kubernetesサービス・レベルのメトリック・データが表示されます。データは特定のサービスに対してフィルタできますが、デフォルトではすべてが表示されます。2つのアラートが組み込まれており、選択した通知チャネルに送信できます。
Kubernetesモニタリング Kubernetesモニタリング・コンテナ Kubernetesモニタリング・ノード	(すべて)	これらのフォルダには、Private Cloud ApplianceシステムのKubernetesクラスタのほとんどの操作をカバーする幅広いモニタリング・データを含む、大規模で多様なダッシュボードのコレクションが含まれています。たとえば、これらのメトリックは、CPU、ディスク、メモリーおよびネットワーク・リソースのデプロイメント、イングレスおよび使用状況に関する情報を提供します。
OKEモニタリング	カポネ	このダッシュボードには、プライベート・クラウド・アプライアンスKubernetesエンジン(OKE)のコンポーネントであるOCIのクラスタAPIプロバイダからのメトリックが表示されます。このダッシュボードは、コンピュート・インスタンスやロード・バランサなどのOKEで使用されるリソースのリクエスト・ステータス・コードおよびレスポンス時間をモニターします。コントローラのリコンシリエーションに関する情報は、Oracle Support用です。
OKEモニタリング	クラスタ時間の監視	このダッシュボードには、特定のOKEクラスタまたはノード・プールの作成または更新などの操作に要した時間が表示されます。すべてのクラスタおよびノード・プールにわたるこれらの操作の平均時間も表示されます。
OKEモニタリング	メトリック・メーター	このダッシュボードには、クラスタAPIプロバイダ、OCI用クラスタAPIプロバイダ、OKEおよびprometheus-k8sなどのOKEサービスで使用される様々なターゲットのヘルスが表示されます。
OKEモニタリング	OKEサービス	このダッシュボードには、OKEのサービス・レベル・メトリックが表示されます。このダッシュボードのメトリックの例には、クラスタおよびノード・プールの作成、更新および削除などのリクエストの数、および様々なリクエストの例外コードの数が含まれます。例外コード数は、リクエスト失敗のパターンを公開するのに役立ちます。

Oracle Cloud Infrastructureドキュメント

Grafanaでのモニタリング・データの表示および解釈