Grafanaアラートの管理

Private Cloud Applianceには、一連の事前定義済Grafanaアラートが含まれています。独自のアラートを追加することもできます。

アラートなど、指定した状態にあるアラートのみを表示できます。アラートをトリガーする値や状態の変更をトリガーする値など、アラートに関する詳細情報を表示できます。多くの場合、これらの値を変更できます。アラートが「Alerting」状態の場合は、アラート定義を表示してその状態になった原因を特定し、この情報を使用してアラートが監視しているコンポーネントを評価し、必要なアクションを判断します。

Grafanaアラートの参照

すべてのアラートを表示するには、ページの左側にある垂直メニューバーのベルアイコンをクリックします。アイコンは各アラートのステータスを示し、アラート名の下のテキストはそのステータスのアラートの期間を示します。

リストの上部にある検索フィールドにテキストを入力して、名前にそのテキストを含むアラートのみを表示します。「状態」リストを使用して、選択した状態のアラート(OK、Not OK、Alerting、No Data、Paused、Pending)のみを表示します。

アラート・リストの上にある「アラートの追加方法」ボタンを使用して、新しいアラートを作成するか、Grafanaホーム・ページで参照されている情報を使用して、アラートを追加または変更し、通知チャネルを追加し、特定のアラートの通知を追加します。

アラート名をクリックすると、アラートの詳細情報が表示されます。これは、ダッシュボードに移動し、メトリックにスクロールしてメトリック名をクリックし、「編集」を選択したときに表示されるページと同じです。

グラフの上にカーソルを置くと、モニター対象のすべてのデータ(各ホスト、スイッチ、デバイス、エンドポイントなど)がリストされます。

グラフの下の「アラート」タブで、ルールを表示および編集できます。アラート・ルールは、1つ以上の問合せと式、条件、評価の頻度、およびオプションで条件が満たされる期間で構成されます。様々なエラー条件に対してアラート状態がどのように設定されているかを確認できます。このアラートの通知メッセージを送信できます。

「状態履歴」ボタンには、このアラートの最後の50状態の変更が表示されます。別のボタンを使用すると、アラートをテストできます。

通知チャネルの追加または構成

通知チャネルを追加または構成するには、ページの左側にあるメニュー・バーのベル・アイコンをクリックし、「通知チャネル」オプションを選択するか、アラートのリストの上部にある「通知チャネル」タブを選択します。

既存の通知チャネルの構成を変更するには、チャネルの名前をクリックします。変更が終了したら、「Save」ボタンをクリックします。「テスト」ボタンをクリックして、テスト通知を送信します。

通知チャネルを追加するには、「通知チャネル」タブに移動し、「新規チャネル」ボタンをクリックして、ページに入力します。「保存」ボタンをクリックします。「テスト」ボタンをクリックして、テスト通知を送信します。「戻る」ボタンをクリックして取り消し、新しい通知チャネルを作成しません。

カスタム外部電子メール通知の設定

電子メール通知を構成するには、Oracle Supportが初期構成を行うためのサービス・リクエスト(SR)を開きます。初期構成が完了したら、Grafanaアラート・ページに移動し、「通知チャネル」タブをクリックして「新規チャネル」ボタンをクリックし、ページに入力し、「タイプ」フィールドで「電子メール」を選択します。

カスタム外部HTTP/HTTPS通知の構成

外部HTTPまたはHTTPSベースのカスタム・アラートを構成するには、次の例に示すように、最初にGrafanaのプロキシを構成する必要があります。

管理仮想IPを所有する管理ノードにログインし、次のコマンドを実行します。

$ sudo curl -u admin_user_name -XPUT \
'https://api.PCA_system_name.your_domain/v1/grafana/proxy/config?http-proxy=proxy_fqdn:proxy_port&https-proxy=proxy_fqdn:proxy_port'
Enter host password for user 'admin_user_name':
Grafana proxy config successfully updated!

次のコマンドを実行して、Grafanaが引き続き内部のLokiおよびPrometheusサービスに接続できるようにします。

$ sudo curl -u admin_user_name -XPUT \
'https://api.PCA_system_name.your_domain/v1/grafana/proxy/config?no-proxy="sauron-sauron-prometheus,sauron-sauron-alertmanager,grafana-loki.loki.svc.cluster.local"'

Grafanaポッドが再起動されます。Grafanaポッド(sauron-sauron-grafana-unique_ID)が実行されていることを確認するまで、次のコマンドを実行します。

$ kubectl get pods -n sauron