Oracle Cloud Infrastructureドキュメント

モニタリング概要

Oracle Cloud Infrastructure Monitoringサービスを使用すると、メトリックおよびアラーム機能を使用して、クラウド・リソースをアクティブかつ直感的にモニターできます。

ノート

「モニタリング」は、Oracle Cloud Infrastructure Government Cloudでは使用できません。

このイメージは、モニタリング・サービスで使用されているメトリックとアラームを示しています。

モニタリングのしくみ

モニタリング・サービスでは、メトリックを使用してリソースとアラームをモニターし、これらのメトリックがファーム固有のトリガーに達したときに通知します。

メトリックは、リソースがRawデータ・ポイントまたはタイムスタンプ値のペアとして、ディメンションおよびメタデータとともにモニタリング・サービスに送信されます。 たとえば、コンピュート・サービス(メトリック・ネームスペース"oci_computeagent")は、モニター可能なコンピュート・インスタンスのこのデータを転送します。 投稿されたデータには、CpuUtilizationなどのすべてのoci_computeagentメトリックが含まれます。 モニタリング・サービスに転送されるメトリック・データは、ユーザーに表示されるか、メトリック・データを使用できるOracle Cloud Infrastructure機能によってのみ使用されます。

メトリックを問い合せると、モニタリング・サービスは指定されたパラメータに従って集計データを返します。 範囲(過去24時間など)、統計、および間隔を指定できます。 コンソールには、選択したリソースのメトリックごとに1つのモニタリング・チャートが表示されます。 各チャートの集約データには、選択した統計および間隔が反映されます。 APIリクエストは、必要に応じてディメンションでフィルタ処理し、解決策を指定できます。 APIレスポンスには、メトリック名とそのソース・コンパートメントおよびメトリック・ネームスペースが含まれます。 集約されたデータをビジュアライゼーションまたはグラフ化ライブラリにフィードできます。

メトリックおよびアラーム・データは、コンソール、CLIおよびAPIを介してアクセスできます。 保存期間の詳細は、「ストレージ制限」を参照してください。

モニタリング・サービスのアラーム機能は、通知サービスによって管理される構成済みの宛先にアラーム・メッセージを発行します。 各宛先は、サブスクライバのセットがあるトピックです。 通知サービスの詳細は、「通知概要」を参照してください。

メッセージ・タイプ
メッセージ形式および例

メトリック機能の概要

メトリック機能は、クラウド・リソースのヘルス、容量およびパフォーマンスに関するメトリック・データをリレーします。 メトリックは、指定したリソースのヘルス、容量またはパフォーマンスに関連した測定です。 リソース、サービス、およびアプリケーションが、モニタリング・サービスに対してメトリックを発行します。 共通メトリックには、次の関連するデータが反映されます:

  • 可用性と待機時間
  • アプリケーションの稼働時間と停止時間
  • 完了済トランザクション
  • 失敗した操作と成功した操作
  • キー・パフォーマンス・インジケータ(KPI)。販売数量およびエンゲージメント数量詞など

モニタリングをこのデータに対して問い合せることで、顧客にコミットするサービス・レベルを達成するためにシステムおよびプロセスがどの程度適切に機能しているかを理解できます。 たとえば、コンピュート・インスタンスのCPU使用率およびディスク読取りをモニターできます。 その後、このデータを使用して、インスタンスの増加を処理するための追加のインスタンスの起動、インスタンスの問題のトラブルシューティング、またはシステムの動作の理解を深めるタイミングを判断できます。

メトリックの例: 失敗率

アプリケーション・ヘルスの場合、共通KPIの1つが失敗率で、共通定義が失敗したトランザクションの数を合計トランザクションで割った数です。 このKPIは、通常、アプリケーション・モニタリングおよび管理ソフトウェアを通じて提供されます。

開発者は、「カスタム・メトリック」を使用して、アプリケーションからこのKPIを取得できます。 アプリケーション・トランザクションが発生するたびに監視を記録して、そのデータを「モニタリング」サービスにポストするのみです。 この場合は、失敗したトランザクション、成功したトランザクションおよびトランザクション待機時間(完了したトランザクション当たりに費やした時間)を取得するメトリックを設定します。

アラーム機能の概要

モニタリング・サービスのアラーム機能は、通知サービスと連動して、メトリックがファーム固有のトリガーを満たしたときに通知します。 構成後、繰返し通知では、構成された繰返し間隔で起動の続行状態が通知されます。 また、アラームがOK状態に戻ったとき、またはアラームがリセットされたときにも通知されます。

「検索」でサポートされている属性を使用して、アラームを検索できます。 「検索」の詳細は、「検索の概要」を参照してください。

検索-アラームについてサポートされている属性

モニタリングの概念

モニタリングを使って作業するには、次の概念が不可欠です。

集計データ
「統計」「間隔」を所定の「メトリック」に選択したraw 「データ・ポイント」に適用した結果。 たとえば、「統計」 max「間隔」 1h (1時間)をmetric CpuUtilizationのraw 「データ・ポイント」の最後の24時間に適用できます。 集計データは、コンソールのデフォルトのメトリック・チャートに表示されます。 集計データの特定セットに対するメトリック問合せを作成することもできます。 手順については、「デフォルトのメトリック・チャートの表示」および「メトリック問合せの作成」を参照してください。
アラーム
アラームが起動状態にあり、ほかのアラーム・プロパティとともに使用される場合に評価する「アラームの問合せ」および「通知の宛先」 アラームの管理手順については、「アラームの管理」を参照してください。
アラームの問合せ
「アラーム」に対して評価するMonitoring Query Language (MQL)式。 アラームの問合せでは、「メトリック」「統計」「間隔」「トリガー・ルール」 (しきい値または非検出)を指定する必要があります。 モニタリング・サービスのアラーム機能は、返される各時系列の結果をブール値として解釈します。ゼロはfalseを表し、0以外の値はtrueを表します。 True値の場合、「トリガー・ルール」条件が満たされていることを意味します。 詳細は、「アラーム」 APIリファレンスの「メトリック問合せの作成」および問合せ属性の説明を参照してください。
データ・ポイント
指定された「メトリック」のタイムスタンプ値のペア。 例 : 2018-05-10T22:19:00Z, 10.4
データ・ポイントは、Rawまたはaggregateのいずれかです。 Rawデータ・ポイントは、「メトリック・ネームスペース」によってモニタリング・サービスにポストされ、PostMetricData操作を使用します。 投稿されるデータ・ポイントの「頻度」は、「メトリック・ネームスペース」によって異なります。 たとえば、カスタム・ネームスペースは、指定された「メトリック」のデータ・ポイントを20-second 「頻度」で送信します。
集計データ・ポイントとは、「統計」および「間隔」をrawデータ・ポイントに適用した結果です。 集計データ・ポイントの「間隔」は、SummarizeMetricsDataリクエストによって決まります。 たとえば、「統計」 sum「間隔」 1h (1時間)を指定するリクエストは、指定された「メトリック」で使用可能なrawデータ・ポイントの時間ごとにsum値を返します。
ディメンション
「メトリック定義」で提供される修飾子。 例: oci_computeagentメトリックの定義で提供されているリソース識別子(resourceId)。 ディメンションを使用して、メトリック・データをフィルタ処理またはグループ化します。 可用性ドメインでフィルタリングするためのディメンションの名前/値ペアの例: availabilityDomain = "VeBZ:PHX-AD-1"
頻度
特定の「メトリック」に対して投稿された各raw 「データ・ポイント」間の期間です。 (Rawデータ・ポイントは、「メトリック・ネームスペース」によってモニタリング・サービスに投稿されます。)頻度はメトリックによって異なり、デフォルトのサービス・メトリックは通常、60秒の頻度(つまり、1分当たり1つの転記済データ・ポイント)を持ちます。 解決も参照してください。
interval
指定されたraw 「データ・ポイント」セットの変換に使用される時間ウィンドウ。
集約されたデータ・ポイントのタイムスタンプは、Rawデータ・ポイントが評価される時間ウィンドウの終了に対応します。 たとえば、5分間隔の場合、タイムスタンプ"2:05"は2: 00から5分間の時間ウィンドウに対応 : nから2:05:00。
このイメージは、集計データ・ポイントのタイムスタンプがどのように間隔に対応しているかを示しています。
次の問合せの例では、5-minute間隔を指定します。 CpuUtilization[5m].max()サポートされている値については、「Monitoring Query Language (MQL)リファレンス」を参照してください。
「解決」も参照してください。
メッセージ
モニタリング・サービスのアラーム機能が、「アラーム」構成「通知の宛先」内のトピックに発行するコンテンツ。 「アラーム」が別の状態("OK"から"FIRING"など)に遷移すると、メッセージが送信されます。 メッセージの詳細は、「モニタリングのしくみ」を参照してください。
メタデータ
「メトリック定義」で提供される参照。 例: 単位(バイト)。oci_computeagent metricDiskBytesReadの定義で指定します。 メタデータを使用して、指定したメトリックに関する追加情報を特定します。 メトリック定義については、「サポート対象サービス」を参照してください。
メトリック
指定したリソースのヘルス、容量またはパフォーマンスに関連する測定です。 例: コンピュート・インスタンスの使用状況を測定するoci_computeagent metricCpuUtilization メトリック定義については、「サポート対象サービス」を参照してください。
ノート

メトリック・リソースにOCIDがありません。
メトリック定義
指定された「メトリック」に対して「メトリック・ネームスペース」によって提供される参照、修飾子およびその他の情報のセット。 たとえば、oci_computeagent metric DiskBytesReadは、「ディメンション」 (リソース識別子など)およびmetadata (単位のバイト数を指定)と、「メトリック・ネームスペース」 (oci_computeagent)を使用して定義されます。 「データ・ポイント」のポストされたセットごとに、この情報が送信されます。 ListMetricData API操作を使用してメトリック定義を取得します。 メトリック定義については、「サポート対象サービス」を参照してください。
メトリック・ネームスペース
リソース、サービス、または「メトリック」を発行するアプリケーションのインジケータ。 「メトリック定義」に指定されています。 たとえば、コンピュート・インスタンスでOracleCloudAgentソフトウェアから送信されるCpuUtilization 「メトリック定義」は、CpuUtilization 「メトリック」のソースとして「メトリック・ネームスペース」 oci_computeagentをリストします。 メトリック定義については、「サポート対象サービス」を参照してください。
メトリック・ストリーム
「メトリック」の個別の「集計データ」セット。 ストリームは、1つのリソースに固有にすることも、コンパートメント内のすべてのリソース全体で集計することもできます。 コンソール「メトリック・チャート」内では、各メトリック・ストリームが1行として表されます。 デフォルトでは、メトリック・ストリームはリソースに固有であるため、チャートには各リソースの線が表示されます。 「すべてのメトリック・ストリームの集計」を選択した場合、チャートにはすべてのリソースが1線で表示されます。
通知の宛先
「アラーム」が"OK"から"FIRING"などの別の状態に遷移すると、「メッセージ」を送信するためのプロトコルおよびその他の詳細。 詳細および設定は、宛先サービスによって異なる場合があります。 通知サービスでは、各宛先に1つのトピックとサブスクリプション・プロトコル(PagerDuty)が含まれています。 メッセージ、トピックおよびサブスクリプションの詳細は、「通知概要」を参照してください。
oraclecloudagentソフトウェア
コンピュート・インスタンスがraw 「データ・ポイント」モニタリング・サービスにポストできるようにするソフトウェア。 サポートされているイメージの最新バージョンを使用して自動的にインストールします。 「コンピュート・インスタンスに対するモニタリングの有効化」も参照してください。
問合せ
「集計データ」を戻すかどうかを評価する、Monitoring Query Language (MQL)式。 この問合せでは、「メトリック」「統計」、および「間隔」を指定する必要があります。 詳細は、「メトリック問合せの作成」を参照してください。
解決
時間ウィンドウ間の期間、または時間ウィンドウがシフトする規則性。 たとえば、1mの解決を使用すると、毎分集約を取得します。
ノート

メトリック問合せの場合、選択した間隔により、リクエストのデフォルト解決が決定され、戻されるデータの最大時間範囲が決定されます。

問合せに対して戻される最大時間範囲

メトリック問合せで使用される解決パラメータの詳細は、SummarizeMetricsDataを参照してください。

アラーム問合せの場合、指定した間隔はリクエストの解決に影響しません。 アラーム問合せリクエストの解決に関して有効な値は、1mのみです。 アラーム問合せで使用される解決パラメータの詳細は、「アラーム」を参照してください。

次の図に示すように、「解決」は前のウィンドウに対する各集約ウィンドウの開始時間を制御し、「間隔」はウィンドウの長さを制御します。 どちらのリクエストも、max統計を5分ごとのウィンドウ内のデータ(間隔から)に適用し、単一の集約「データ・ポイント」がそのウィンドウのもっとも高いCPUutilizationカウンタを表します。 解決値のみが異なります。 この解決により、集計ウィンドウが移動するか、連続した集計ウィンドウの開始時間になる、正則が変化します。 リクエストAは解決を指定していないため、間隔(5)に等しいデフォルト値を使用します。 このリクエスト5分間の集約ウィンドウが、0から出現したデータ・ポイントのセットから取得されます:nから5:00、5:nから10:00などです。 リクエストBは1-minuteの解決を指定するため、5分間の集計ウィンドウは、1分ごとに表示されるデータ・ポイントのセットから取得されます:nから5:00、1:nから6:00などです。
このイメージは、解決に従った集約ウィンドウの開始方法を示しています。
統計
指定されたraw 「データ・ポイント」セットに適用されている集計関数。 サポートされている統計については、「Monitoring Query Language (MQL)リファレンス」を参照してください。
抑制
指定された時間範囲内で「メッセージ」が公開されないようにする構成。 システムのメンテナンス中にアラーム通知を一時停止するのに役立ちます。 各抑制は単一のアラームに適用されます。 コンソールでは、抑制の定義を1つ複数のアラームに適用できます。 結果は、各アラームについて個別に抑止されます。 アラームの抑制手順については、「アラームを抑制するには」を参照してください。
トリガー・ルール
アラームが起動状態になるために満たす必要がある状態。 トリガー・ルールは、メトリックのしきい値または欠落に基づきます。

可用性

「モニタリング」は、現在以下のリージョンで利用可能です:

リージョン名 リージョンのロケーション リージョン・キー
ap-seoul-1 アジア太平洋: ソウル、韓国 ICN
ap-tokyo-1 アジア太平洋: 東京、日本 NRT
ca-toronto-1 カナダ: トロント YYZ
eu-frankfurt-1 ヨーロッパ: フランクフルト、ドイツ FRA
uk-london-1 イギリス: ロンドン LHR
us-ashburn-1 アメリカ合衆国: アッシュバーン、VA IAD
us-phoenix-1 アメリカ合衆国: フェニックス、AZ PHX

サポートされているサービス

次のサービスには、メトリックを生成できるリソースまたはコンポーネントがモニタリングに含まれます:

リソース識別子

ほとんどのタイプのOracle Cloud Infrastructureリソースには、Oracle Cloud ID (OCID)という名前の一意のOracle割当て識別子があります。 OCID形式およびリソースを識別するその他の方法については、「リソース識別子」を参照してください。

ノート

メトリック・リソースにOCIDがありません。

モニタリングにアクセスする方法

コンソール (ブラウザベースのインタフェース)またはREST APIを使用して「モニタリング」サービスにアクセスできます。 コンソールおよびAPIの手順は、このガイドのトピックに含まれています。 使用可能なSDKのリストは、「ソフトウェア開発キットとコマンドライン・インタフェース」を参照してください。

コンソール: コンソールを使用してモニタリングにアクセスするには、サポートされているブラウザを使用する必要があります。 このページの上部にあるコンソール・リンクを使用して、サインイン・ページにアクセスできます。 クラウド・テナント、ユーザー名、およびパスワードを入力するよう求められます。 「ナビゲーション・メニュー」を開きます。 ソリューションおよびプラットフォームで、モニタリングに移動します。

API: モニタリング経由でapiにアクセスするには、モニタリングAPIをメトリックおよびアラームに使用し、通知にはNotifications APIを使用します(アラームで使用)。

アラームの別のコンパートメントへの移動

あるコンパートメントから別のコンパートメントに「アラームの移動」を作成できます。 アラームを新しいコンパートメントに移動しても、その関連メトリックはどこにあってもそのまま残ります。 新しいコンパートメントにアラームを移動すると、専用のポリシーがただちに適用され、コンソールを通じてアラームへのアクセスに影響を与えます。 リソースを他のコンパートメントに移動する方法の詳細は、「別のコンパートメントへのリソースの移動」を参照してください。

重要

リソースをコンパートメント間で移動するには、リソースが移動されるコンパートメントと現在のコンパートメントに対して十分なアクセス権がリソース・ユーザーに必要です。
「モニタリング」リソースの権限の詳細は、「モニターの詳細」を参照してください。

認証と認可

Oracle Cloud Infrastructureの各サービスは、すべてのインタフェース(コンソール、SDKまたはCLI、およびREST API)の認証および認可のためにIAMと統合されています。

組織の管理者は、どのユーザーがどのサービス、どのリソースおよびアクセスのタイプにアクセスできるかを制御するグループ、コンパートメントおよびポリシーを設定する必要があります。 たとえば、ポリシーは、新しいユーザーの作成、クラウド・ネットワークの作成と管理、インスタンスの起動、バケットの作成、オブジェクトのダウンロードなどを実行できるユーザーを制御します。詳細は、「ポリシーの開始」を参照してください。 異なる各サービスに対するポリシーの記述の詳細は、「ポリシー・リファレンス」を参照してください。

会社が所有するOracle Cloud Infrastructureリソースを使用する必要がある通常のユーザー(管理者ではない)の場合は、管理者に連絡してユーザーIDを設定してください。 管理者は、使用する必要があるコンパートメントを確認できます。

管理者: メトリックへのグループ・アクセス権を付与する共通ポリシーについては、「ユーザーにコンパートメント内のメトリック定義を表示させる」および「特定のメトリック・ネームスペースへのユーザー・アクセスを制限」を参照してください。 共通のアラーム・ポリシーについては、「ユーザーがアラームを表示できるようにします」を参照してください。 インスタンスなどのリソースを認可してAPIコールを行うには、リソースを「動的グループ」に追加します。 動的グループ一致ルールを使用してリソースを追加し、その動的グループによるメトリックへのアクセスを許可するポリシーを作成します。 「インスタンスがAPIコールを行ってテナンシ内のモニタリング・メトリックにアクセスできるようにします」も参照してください。

モニタリングの制限

適用可能な制限の一覧と制限の増加をリクエストする手順については、「モニタリング制限」を参照してください。

その他の制限には次のものがあります。

ストレージ制限

項目 格納される時間範囲
メトリック定義 14日
アラーム履歴のエントリ 90日

返されるデータ制限(メトリック)

「問合せメトリック」および「メトリック・チャートの表示」では、返されるデータに特定の制限が適用されます。 戻されたデータの情報を制限するために、最大値と「時間範囲の最大値(間隔に関連する解像度で決定)」の100,000のデータ・ポイントがあります。 『MetricDataリファレンス』も参照してください。

制限のトラブルシューティング

問合せがメトリック・ストリームの最大数を超えたというエラーが表示される場合は、制限内にある複数のメトリック・ストリームを評価するように問合せを更新します。 たとえば、ディメンションを指定することでメトリック・ストリームを削減できます。 複数の問合せ(またはアラーム)にメトリック・ストリームを分散することで、元の問合せにあるすべてのメトリック・ストリームの評価を続行できます。