Grafanaでのモニタリング・データの表示および解釈

Private Cloud Applianceのインフラストラクチャ・サービス・レイヤーは、プラットフォーム上に構築され、すべてのクラウド・ユーザーおよび管理者機能を有効にし、Grafanaダッシュボードの広範なコレクションを通じて監視できます。

これらのマイクロサービスは、Kubernetesコンテナの3つの管理ノードにデプロイされるため、その監視は主にKubernetesノードとポッド・メトリックに基づきます。Kubernetesクラスタはコンピュート・ノードにも拡張され、Kubernetesワーカー・ノードはシステムの運用と監視のために重要な追加データを収集します。

この項で説明するダッシュボードは、マイクロサービスのヘルス・モニタリングの開始点として適しています。かわりに、様々なダッシュボード、メトリックおよびビジュアライゼーションを使用することをお薦めします。システム全体にわたって収集される必要なデータはPrometheusに格納され、Grafanaを介して様々な方法で照会および表示できます。

Grafanaフォルダ

ダッシュボード

摘要

サービスのモニタリング

ClusterLabs HAクラスタの詳細

このダッシュボードでは、Pacemakerに基づいてHAクラスタのデータを表示するために、特注のPrometheusエクスポータを使用します。各HTTPリクエストで、クラスタ・コンポーネントのツールによって提供される既存の分散データを解析することによって、クラスタ・ステータスをローカルに検査します。

モニタリングデータには、Pacemakerクラスタのサマリー、ノードとリソースの統計、およびCorosyncリングエラーと定足数投票が含まれます。

サービスのモニタリング

MySQL Clusterエクスポータ

このダッシュボードには、MySQLデータベース・クラスタのパフォーマンス詳細が表示されます。データには、稼働時間、接続統計、表のロック数などのデータベース・サービス・メトリックに加え、MySQLオブジェクト、接続、ネットワーク・トラフィック、メモリーおよびCPU使用率に関するより一般的な情報が含まれます。

サービスのモニタリング

サービス・レベル

このダッシュボードには、基本的なアプライアンス・サービスによって受信されるRabbitMQリクエストに関する詳細情報が表示されます。これにより、リクエストの数、リクエストの待機時間、およびエラーの原因となったリクエストを監視できます。

サービスのモニタリング

VM統計

この包括的なダッシュボードには、ご使用の環境のコンピュート・インスタンス全体のリソース消費情報が表示されます。これには、CPUおよびメモリーの使用率、ディスク・アクティビティ、ネットワーク・トラフィックなどのグラフが含まれます。

このダッシュボードのパネルには、1つのグラフに多数の時系列が表示されます。クリックすると1つの時系列を表示したり、グラフの上にカーソルを置くと、時間軸上の特定のポイントで詳細データを表示できます。

PCA 3.0サービス・アドバイザ

Kubeエンドポイント

このダッシュボードは、Kubernetesエンドポイントに特に重点を置いており、エンドポイント・アラートを提供します。これらのアラートは、選択した通知チャネルに送信できます。

PCA 3.0サービス・アドバイザ

Kube Ingress

このダッシュボードは、Kubernetesサービスとそのポッドへのイングレス・トラフィックに関するデータを提供します。2つのアラートが組み込まれており、選択した通知チャネルに送信できます。

PCA 3.0サービス・アドバイザ

Kubeノード

このダッシュボードには、Kubernetesクラスタおよびホスト・マイクロサービス・ポッドに属するすべてのサーバー・ノードのメトリック・データ(つまり、管理およびコンピュート・ノード)が表示されます。ポッド数、CPUおよびメモリー使用量などを監視できます。メトリック・パネルには、すべてのノードの情報が表示されます。グラフベースのパネルでは、クリックして単一ノードの情報を表示できます。

PCA 3.0サービス・アドバイザ

Kube Pod

このダッシュボードには、マイクロサービス・ポッドのレベルでメトリック・データが表示され、ポッド全体の合計数およびノード間でのポッドの分散方法を表示できます。ネームスペースおよびサービスごとにステータスをモニターし、アラートがトリガーされたかどうかを確認できます。

PCA 3.0サービス・アドバイザ

Kubeサービス

このダッシュボードには、Kubernetesサービス・レベルのメトリック・データが表示されます。データは特定のサービスに対してフィルタできますが、デフォルトではすべてが表示されます。2つのアラートが組み込まれており、選択した通知チャネルに送信できます。

Kubernetesモニタリング

Kubernetesモニタリング・コンテナ

Kubernetesモニタリング・ノード

(すべて)

これらのフォルダには、Private Cloud ApplianceシステムのKubernetesクラスタのほとんどの操作をカバーする幅広いモニタリング・データを含む、大規模で多様なダッシュボードのコレクションが含まれています。たとえば、これらのメトリックは、CPU、ディスク、メモリーおよびネットワーク・リソースのデプロイメント、イングレスおよび使用状況に関する情報を提供します。

OKEモニタリング

カポネ

このダッシュボードには、プライベート・クラウド・アプライアンスKubernetesエンジン(OKE)のコンポーネントであるOCIのクラスタAPIプロバイダからのメトリックが表示されます。このダッシュボードは、コンピュート・インスタンスやロード・バランサなどのOKEで使用されるリソースのリクエスト・ステータス・コードおよびレスポンス時間をモニターします。

コントローラのリコンシリエーションに関する情報は、Oracle Support用です。

OKEモニタリング

クラスタ時間の監視

このダッシュボードには、特定のOKEクラスタまたはノード・プールの作成または更新などの操作に要した時間が表示されます。すべてのクラスタおよびノード・プールにわたるこれらの操作の平均時間も表示されます。

OKEモニタリング

メトリック・メーター

このダッシュボードには、クラスタAPIプロバイダ、OCI用クラスタAPIプロバイダ、OKEおよびprometheus-k8sなどのOKEサービスで使用される様々なターゲットのヘルスが表示されます。

OKEモニタリング

OKEサービス

このダッシュボードには、OKEのサービス・レベル・メトリックが表示されます。このダッシュボードのメトリックの例には、クラスタおよびノード・プールの作成、更新および削除などのリクエストの数、および様々なリクエストの例外コードの数が含まれます。例外コード数は、リクエスト失敗のパターンを公開するのに役立ちます。