Oracle NoSQL Database Cloud Serviceのモニター
Oracle Cloud Infrastructure Monitoringサービスを使用すると、メトリックおよびアラーム機能を使用してクラウド・リソースを能動的および受動的にモニターできます。モニタリング・サービスは、メトリックを使用してリソースおよびアラームをモニターして、これらのメトリックでアラーム指定のトリガーを満たしたときに通知を行います。
メトリックとは、特定のリソースのヘルス、容量またはパフォーマンスに関連する測定です。アラームはトリガー・ルールおよび問合せです。アラームは、メトリックを使用してクラウド・リソースを受動的にモニターしますアラームの作成時に通知設定を構成できます。
メトリックが、モニタリング・サービスに対し、Rawデータ・ポイント(指定したメトリックのタイムスタンプ/値ペア)として、ディメンション(メトリック定義で提供されるリソース識別子)およびメタデータと一緒に発行されます。モニタリング・サービスは、通知サービスによって管理される構成済の宛先にアラム・メッセージを公開します。
メトリックを問い合せると、モニタリング・サービスは指定されたパラメータに従って集計データを返します。範囲(過去24時間など)、統計および間隔を指定できます。統計は、RAWデータ・ポイントに適用される集計関数です。SUM集計関数は、統計の例です。間隔とは、RAWデータ・ポイントの指定したセットの変換に使用される時間ウィンドウです。たとえば、5分などです。
コンソールには、選択したリソースのメトリックごとに1つのモニタリング・グラフが表示されます。各グラフ内の集計データは、選択した統計および間隔を反映します。APIリクエストは、必要に応じてディメンションでフィルタリングし、レゾリューションを指定できます。APIレスポンスには、メトリック名とともにソースのコンパートメントとメトリック・ネームスペースが含まれます(メトリックを発行するリソース、サービスまたはアプリケーションを示します)。ネームスペースは、メトリック定義で指定されます。たとえば、Oracle Cloudによって発行されたCpuUtilizationメトリック定義には、メトリック・ソースとしてoci_computeagentメトリック・ネームスペースがリストされます。
メトリックおよびアラーム・データは、コンソール、CLIおよびAPIを介してアクセスできます。OCIモニタリング・サービスの概念の詳細は、モニタリングの概念を参照してください。
この記事には次のトピックが含まれます:
Oracle NoSQL Database Cloud Serviceメトリック
Oracle NoSQL Database Cloud Serviceは、メトリック・ネームスペースoci_nosqlを使用してメトリックを発行します。
Oracle NoSQL Database Cloud Serviceのメトリックには、次のディメンションが含まれます:
RESOURCEIDOracle NoSQL Database Cloud ServiceのNoSQL表のOCID。
ノート: OCIDは、Oracleによって割り当てられた一意のIDで、コンソールとAPIの両方でリソースの情報の一部として含まれます。
-
TABLENAMEOracle NoSQL Database Cloud Service内のNoSQL表の名前。
-
REPLICA別のリージョンから表更新を受信するリージョンの名前。
Oracle NoSQL Database Cloud Serviceにより、メトリックがOracle Cloud Infrastructure Monitoring Serviceに送信されます。Oracle Cloud Infrastructure Console SDKまたはCLIを使用して、これらのメトリックに対するアラームを表示または作成できます。
表- Oracle NoSQL Database Cloud Serviceメトリック
| メトリック | メトリック表示名 | 単位 | 説明 | サイズ |
|---|---|---|---|---|
ReadUnits |
読取りユニット | Units | この期間中に消費された読取りユニットの数。 | resourceId tableName |
WriteUnits |
書込みユニット | Units | この期間中に消費された書込みユニットの数。 | resourceId tableName |
StorageGB |
ストレージ・サイズ | GB | 表で消費されたストレージの最大量この情報は1時間ごとに生成されるため、リフレッシュ・ポイントの間にある期限切れの値が表示される場合があります。 | resourceId tableName |
ReadThrottleCount |
読取りスロットル | カウント | 期間中のこの表での読取りスロットル例外の数。 | resourceId tableName |
WriteThrottleCount |
書込みスロットル | カウント | 期間中のこの表での書込みスロットル例外の数。 | resourceId tableName |
StorageThrottleCount |
ストレージ・スロットル | カウント | 期間中のこの表でのストレージ・スロットル例外の数。 | resourceId tableName |
MaxShardSizeUsagePercent |
最大シャード・サイズ使用率 | パーセンテージ | シャードに割り当てられた合計領域に対するシャードで使用された領域の比率。これは表に固有であり、すべてのシャードで最大の値になります。 | resourceId tableName |
Replica Lag |
レプリカ遅延 | Millisecond | グローバル・アクティブ表のデータ変更を送信者リージョンから受信者リージョンにレプリケートする際のタイム・ラグ。 | |
また、要件に従ってカスタム・メトリックを公開できます。たとえば、メトリックを設定して、アプリケーション・トランザクションのレイテンシ(完了したトランザクション当たりの所要時間)を取得し、そのデータをモニタリング・サービスにポストできます。
NDCSメトリックの説明
Oracle NoSQL Database Cloud Serviceにより、メトリックがOracle Cloud Infrastructure Monitoring Serviceに送信されます。
読取りユニット:
この期間中に消費された読取りユニットの数。これは、最終的に一貫性のある読取り操作のために使用される1秒当たり最大1KBのデータのスループットである。データが1KBを超える場合は、それを読み取るために複数の読取りユニットが必要になります。表の読取りユニットのメトリック・チャートを次に示します。このメトリックは1分ごとに取得され、メトリック・チャートはデフォルトで5分の間隔でプロットされます。

書込みユニット:
この期間中に消費された書込みユニットの数。これは、書込み操作に対する1秒当たり最大1 KBのデータのスループットです。書込み操作は、挿入、更新および削除操作中にトリガーされます。データが1KBを超える場合は、それを書き込むために複数の読取りユニットが必要になります。表の書込みユニット・メトリック・チャートを次に示します。このメトリックは1分ごとに取得され、メトリック・チャートはデフォルトで5分の間隔でプロットされます。

StorageGB:
表で消費されたストレージの最大量表のストレージ・メトリック・チャートを次に示します。このメトリックは1分ごとに取得され、メトリック・チャートはデフォルトで5分の間隔でプロットされます。
ノート:ストレージ・サイズ・トラッキングの開始をシードするには、表の作成から1時間かかります。最初の1時間後、ストレージ統計は5分ごとに更新されます。

ノート:ストレージGBメトリックは切り捨てられます。したがって、1 GB未満のストレージ使用量は0として表示されます。使用量が1 GBを超えると、チャートにストレージが表示され始めます。
ReadThrottleCount:
これは、期間内の指定された表に対する読取りスロットル例外の数を示します。通常、スロットル例外は、プロビジョニングされた読取りスループットを超えたことを示します。これらを頻繁に取得する場合は、表の読取りユニットを増やすことを検討してください。表の読取りスロットル数のメトリック・チャートを次に示します。このメトリックは1分ごとに取得され、メトリック・チャートはデフォルトで5分の間隔でプロットされます。

WriteThrottleCount:
これは、期間内の指定された表に対する書込みスロットル例外の数を示します。通常、スロットル例外は、プロビジョニングされた書込みスループットを超えたことを示します。これらを頻繁に取得する場合は、表の書込みユニットを増やすことを検討してください。表の書込みスロットル数のメトリック・チャートを次に示します。このメトリックは1分ごとに取得され、メトリック・チャートはデフォルトで5分の間隔でプロットされます。

StorageThrottleCount:
これは、期間内の指定された表のストレージ・スロットル例外の数を示します。通常、スロットル例外は、プロビジョニングされたストレージ容量を超えたことを示します。これらを頻繁に取得する場合は、表のストレージ容量を増やすことを検討してください。表のストレージ・スロットル数のメトリック・チャートを次に示します。このメトリックは1分ごとに取得され、メトリック・チャートはデフォルトで5分の間隔でプロットされます。

最大シャード・サイズ使用率
特定の表に対するシャード内の領域の最大使用量(そのシャードで使用されている領域の割合)。
ノート: Oracle NoSQL Database Cloud Serviceでは、シャードにキーをハッシュして、表の記憶域を提供するストレージ・ノードの集合に分散します。直接は表示されませんが、Oracle NoSQL Database Cloud Service表は、可用性とパフォーマンスのためにシャーリングされ、レプリケートされます。シャード・キーは、100%が主キーと一致するか、主キーのサブセットです。データ・ローカリティを実現するために、シャード・キーを共有するすべてのレコードが共存します。
maxShardSizeUsagepercentが100に達すると、表での書込み操作は実行できなくなります。表への書込みを実行するには、ストレージ容量を増やす必要があります。このメトリックは、NoSQL表にストレージ・ホットスポットが存在するかどうかの判断に役立ちます。
このシナリオは、表データがシャード間でどのように格納されるかに不均衡が原因で発生します。不均衡は、表データの大部分がシャードのサブセットに格納される場合に発生することがあります。NoSQLデータベース内の記憶域はシャードされ、シャード・キーは表定義の一部です。階層表では、親表と子表が同じシャード・キーを共有します。子表を含む親表がある場合、すべてのレコードが同じシャード・キーを共有します。したがって、これらのデータはすべて一緒に保管されます。親表の子数が少ない場合、1つのシャード内のストレージ領域が少なくなります。この不均衡のため、特定のシャードには他のシャードよりもはるかに多くのデータを含めることができます。
ある時点で、1つのシャードが特定の表の領域の最大使用量を持ち、そのシャードで使用されている割合はMaxShardSizeUsagePercentです。表のmaxShardSizeUsagepercentメトリック・チャートを次に示します。このメトリックは1分ごとに取得され、メトリック・チャートはデフォルトで5分の間隔でプロットされます。

メトリックのチャートの表示に加えて、次のオプションがあります。

表ビューを取得して、特定の時点におけるメトリックの値を確認できます。

MaxShardSizeUsagePercentメトリックの監視
このチャートを定期的に監視して、maxShardSizeUsagepercentに到達したかどうかを確認する必要があります。このメトリックのアラームを事前に作成できます。

つまり、メトリックが特定の値(たとえば、90%)に達したときにアラームをトリガーする必要があります。

OCIアラームは、OCI通知サービスを使用して通知を送信します。通常、アラームは、構成された電子メールを介して通知を送信するように構成されます。maxShardSizeUsagepercentが90%に達すると、電子メール通知が送信されます。

詳細は、アラームおよび通知の管理を参照してください。
表データがシャード間で分散される方法に不均衡がある場合、表に割り当てられたストレージ容量を最大限に活用することはできません。このシナリオでは、表に割り当てられた記憶域全体を使用しない場合でも、maxShardSizeUsagepercentは値100に達します。表への書込みを続行するには、記憶域を追加する必要があります。このシナリオは、表の設計中にいくつかのガイドラインに従うことで回避できます。
-
表の正しいシャード・キーを決定します。カーディナリティが高い属性は、シャード・キーに適しています。
-
シャード記憶域の不均衡状態を回避するために、子表の数を制限します。
レプリカ遅延
グローバル・アクティブ表のデータ変更(INSERT/UPDATEまたはDELETE)を送信者リージョンから受信者リージョンにレプリケートする際のタイム・ラグ。グローバル・アクティブ表の送信側リージョンで発生した書込み操作は、タイム・ラグ後に受信側リージョンに反映されます。タイム・ラグに関する情報は、レプリカ・ラグと呼ばれるメトリックとして表されます。レプリカ・ラグは、受信側レプリケーション・リージョン内の表データが、送信側リージョンの表のデータと比較してどの程度現在のものであるかを示すメジャーです。レプリカ・ラグは、受信側リージョン内の表が、ラグ期間中に発生した送信側リージョンからの更新をまだ受信していないことを示します。送信側リージョンに表に対するアプリケーション書込みがない場合、サービスは遅延の近似を計算するためにPingメカニズムを使用し、受信側リージョンでラグ統計を引き続き使用できます。
レプリカ・ラグに関する情報を取得します。
受信者リージョンで、グローバル・アクティブ表をクリックし、表情報を表示します。「リソース」で、「メトリック」をクリックします。レプリケーション・ラグをミリ秒単位で表示するメトリックレプリカ・ラグが表示されます。次のサンプル・チャートでは、Replica Lagメトリックが受信側リージョンであるCanada Southeast (Toronto)リージョンで取得されていることがわかります。このグローバル・アクティブ表には、カナダ南東部(モントリオール)リージョンと米国東部(アッシュバーン)リージョンにそれぞれ1つずつ、2つのリージョン表レプリカがあります。チャートには、モントリオールおよびアッシュバーンのこれらのリージョナル表レプリカに対してそれぞれ2つの線分があることがわかります。
次のチャートの「間隔」は、チャートをプロットするために使用される時間ウィンドウを示します。使用可能な間隔オプションは、1分、5分、1時間および1日です。デフォルトでは、レプリカ・ラグは1分ごとに監視され、チャートは5分ごとにプロットされます。「レプリカ・ラグ」メトリックに「異なる統計」を選択できます。
例1:受信側リージョンとしてカナダ南東部(トロント)、送信側リージョンとしてカナダ南東部(モントリオール)および米国東部(アッシュバーン)を使用したレプリカ・ラグ。
次のチャートは、5分間隔の平均統計についてプロットされています。

この例では、モントリオールとアッシュバーンが2つの送信者リージョンで、トロントがメトリックが取得される受信者リージョンです。Montrealの12:25 UTCのReplica Lagの値について考えてみます。2020ミリ秒です。これは、受信地域カナダ南東部(トロント)が、過去2020ミリ秒で送信者地域カナダ南東部(モントリオール)で発生した更新を受信していないことを意味します。同様に、アッシュバーンの12:25 UTCのレプリカ・ラグの値も考慮してください。2954ミリ秒です。これは、受信地域カナダ南東部(トロント)が、過去2954ミリ秒で送信者地域アメリカ東部(アッシュバーン)で発生した更新を受信していないことを意味します。
例2:受信側リージョンとしてUS East (Ashburn)を使用し、送信側リージョンとしてCanada Southeast (Montreal)およびCanada Southeast Torontoを使用するレプリカ・ラグ。
この例では、モントリオールとトロントは2つの送信者リージョンで、アッシュバーンがメトリックが取得される受信者リージョンです。

例3:受信側リージョンとしてカナダ南東部(モントリオール)、送信側リージョンとして米国東部(アッシュバーン)およびカナダ南東部トロントを使用したレプリカ・ラグ。
この例では、AshburnとTorontoが2つの送信側リージョンで、Montrealがメトリックが取得される受信側リージョンです。

レプリカ・ラグのチャートの表示に加えて、次のオプションがあります。

表ビューを取得して、特定の時点でのレプリカ・ラグの値を確認できます。

Oracle NoSQL Database Cloud Serviceメトリックの表示または一覧表示
コンソールから、Oracle NoSQL Database Cloud Serviceで使用可能なメトリックを表示できます。また、OCI CLIコマンドを使用して、Oracle NoSQL Database Cloud Serviceで使用可能なメトリックのリストを取得できます。
-
ナビゲーション・メニューを開き、「監視および管理」をクリックします。「モニタリング」で、「サービス・メトリック」をクリックします。
-
「コンパートメント」および「メトリック・ネームスペース」(oci_nosql)を選択します。
Cloud Shellから、次のコマンドを実行します。リクエストで指定された基準に一致するメトリック定義を返します。コンパートメントOCIDが必要です。listコマンドで使用可能なOPTIONSの詳細は、メトリックのリストを参照してください。
oci monitoring metric list --compartment-id <Compartment_OCID> --namespace oci_nosql
たとえば:
oci monitoring metric list --compartment-id ocid1.compartment.oc1..aaaaaaaawrmvqjzoegxbsixp5k3b5554vlv2kxukobw3drjho3f7nf5ca3ya --namespace oci_nosql
レスポンスの例:
{
"data": [
{
"compartment-id": "ocid1.compartment.oc1..aaaaaaaawrmvqjzoegxbsixp5k3b5554vlv2kxukobw3drjho3f7nf5ca3ya",
"dimensions": {
"resourceId": "ocid1_nosqltable_oc1_phx_amaaaaaau7x7rfyasvdkoclhgryulgzox3nvlxb2bqtlxxsrvrc4zxr6lo4a",
"tableName": "demo"
},
"name": "ReadThrottleCount",
"namespace": "oci_nosql",
"resource-group": null
},
{
"compartment-id": "ocid1.compartment.oc1..aaaaaaaawrmvqjzoegxbsixp5k3b5554vlv2kxukobw3drjho3f7nf5ca3ya",
"dimensions": {
"resourceId": "ocid1_nosqltable_oc1_phx_amaaaaaau7x7rfyasvdkoclhgryulgzox3nvlxb2bqtlxxsrvrc4zxr6lo4a",
"tableName": "demo"
},
"name": "ReadUnits",
"namespace": "oci_nosql",
"resource-group": null
},
{
"compartment-id": "ocid1.compartment.oc1..aaaaaaaawrmvqjzoegxbsixp5k3b5554vlv2kxukobw3drjho3f7nf5ca3ya",
"dimensions": {
"resourceId": "ocid1_nosqltable_oc1_phx_amaaaaaau7x7rfyasvdkoclhgryulgzox3nvlxb2bqtlxxsrvrc4zxr6lo4a",
"tableName": "demo"
},
"name": "StorageGB",
"namespace": "oci_nosql",
"resource-group": null
},
{
"compartment-id": "ocid1.compartment.oc1..aaaaaaaawrmvqjzoegxbsixp5k3b5554vlv2kxukobw3drjho3f7nf5ca3ya",
"dimensions": {
"resourceId": "ocid1_nosqltable_oc1_phx_amaaaaaau7x7rfyasvdkoclhgryulgzox3nvlxb2bqtlxxsrvrc4zxr6lo4a",
"tableName": "demo"
},
"name": "StorageThrottleCount",
"namespace": "oci_nosql",
"resource-group": null
},
{
"compartment-id": "ocid1.compartment.oc1..aaaaaaaawrmvqjzoegxbsixp5k3b5554vlv2kxukobw3drjho3f7nf5ca3ya",
"dimensions": {
"resourceId": "ocid1_nosqltable_oc1_phx_amaaaaaau7x7rfyasvdkoclhgryulgzox3nvlxb2bqtlxxsrvrc4zxr6lo4a",
"tableName": "demo"
},
"name": "WriteThrottleCount",
"namespace": "oci_nosql",
"resource-group": null
},
{
"compartment-id": "ocid1.compartment.oc1..aaaaaaaawrmvqjzoegxbsixp5k3b5554vlv2kxukobw3drjho3f7nf5ca3ya",
"dimensions": {
"resourceId": "ocid1_nosqltable_oc1_phx_amaaaaaau7x7rfyasvdkoclhgryulgzox3nvlxb2bqtlxxsrvrc4zxr6lo4a",
"tableName": "demo"
},
"name": "WriteUnits",
"namespace": "oci_nosql",
"resource-group": null
}
]
}
Oracle NoSQL Database Cloud Serviceメトリックを収集する方法を教えてください。
メトリック問合せを作成して、特定のメトリック・セット(集計データ)を収集できます。メトリック問合せには、集計データを返すために評価するMonitoring Query Language (MQL)式が含まれます。問合せでは、メトリック、統計および間隔を指定する必要があります。
メトリック問合せを使用して、クラウド・リソースを積極的および受動的にモニターできます。オンデンドで自然生成的に生成するメトリック問合せによって、積極的にモニターします。コンソールで、複数の問合せからのデータが表示されるようにチャートを更新します。再利用する問合せを格納します。条件またはトリガー・ルールをメトリック問合せに追加するアラームを使用して受動的にモニターします。
メトリック問合せの構文:
metric[interval] {dimensionname=dimensionvalue}.groupingfunction.statistic
しきい値アラーム問合せ構文:
metric[interval]{dimensionname=dimensionvalue}.groupingfunction.statistic alarmoperator alarmvalue
サポートされているパラメータ値については、Monitoring Query Language (MQL)リファレンスを参照してください。
問合せの例 単純なメトリック問合せ
1分間隔でのコンパートメント内のすべての表のストレージ・スロットル数の合計。
メトリック・チャート(コンソール)に表示される行数: 表ごとに1行。
StorageThrottleCount[1m].sum()
フィルタされたメトリック問合せ
1分間隔でのコンパートメント内のストレージ・スロットル数の合計で、単一の表にフィルタされます。
メトリック・チャート(コンソール)に表示される行数: 表ごとに1行。
StorageThrottleCount[1m]{tableName = "demoKeyVal"}.sum()
集計メトリック問合せ
60分間隔での読取り操作の集計平均。コンパートメントにフィルタされ、平均に対して集計されます。
メトリック・チャート(コンソール)に表示される行数: 表ごとに1行。
ReadUnits[60m]{compartmentId="ocid1.compartment.oc1.phx..exampleuniqueID"}.grouping().mean()
グループ集計されたメトリック問合せ
読取りユニット別の読取りスロットル数の集計平均(60分間隔)で、コンパートメント内の単一の表にフィルタされます。
メトリック・チャート(コンソール)に表示される行数: 読取りユニットごとに1行。
ReadThrottleCount[60m]{tableName = "demoKeyVal"}.groupBy(ReadUnits).mean()
メトリック問合せの作成
メトリック問合せを作成するには、次の2つの方法があります。コンソールまたはOCI CLIコマンドを使用して問合せを作成できます。
-
ナビゲーション・メニューを開き、「監視および管理」をクリックします。「モニタリング」で、「メトリック・エクスプローラ」をクリックします。
「メトリック・エクスプローラ」ページに、問合せを作成するためのフィールドを含む空のチャートが表示されます。
-
新しいクエリーのフィールドに入力します。
-
コンパートメント:モニターするOracle NoSQL Database Cloud Service表を含むコンパートメント。デフォルトでは、最初にアクセス可能なコンパートメントが選択されます。
-
メトリック・ネームスペース:モニターする表のメトリックを生成するOracle NoSQL Database Cloud Service。例: oci_nosql。
-
リソース・グループ(オプション):メトリックが属するグループ。リソース・グループは、カスタム・メトリックで提供されるカスタム文字列です。サービス・メトリックには適用されません。
-
メトリック名:メトリックの名前。指定できるメトリックは1つのみです。メトリックの選択は、選択したコンパートメントとメトリック・ネームスペースによって異なります。例: ReadUnits
-
間隔:集計ウィンドウ。
-
統計:集計関数。
-
メトリック・ディメンション:評価されるメトリック・データを絞り込むためのオプションのフィルタ。
- ディメンション・フィールド: Oracle NoSQL Database Cloud Serviceメトリックの場合、ディメンション名およびディメンション値のペアとしてresourceIdまたはtableNameを選択できます。
-
メトリック・ストリームの集計:メトリック・チャートに1行表示して、選択した統計のメトリックは、すべて合計した値を表します。
-
-
「チャートの更新」をクリックします。
チャートには、新規問合せの結果が表示されます。非常に小さい値または大きい値は、メガ(10の6乗)のMなど、国際単位系(SI単位)で示されます。単位は選択したメトリックに対応し、統計によって変更されることはありません。
-
問合せをMonitoring Query Language (MQL)式として表示するには、拡張モードを選択します。
-
拡張モードは、チャートの下の右側にあります。
拡張モードで、MQL構文を使用して問合せを編集し、結果をグループ別に集計するために使用します。MQL構文では、追加のパラメータ値もサポートされています。基本および拡張モードの問合せパラメータの詳細は、Monitoring Query Language (MQL)リファレンスを参照してください。
-
Cloud Shellから、次のコマンドを実行します。これは、リクエストで指定された基準に一致する集計データを返します。コンパートメントOCIDが必要です。
oci monitoring metric-data summarize-metrics-data --compartment-id<Compartment_OCID> --namespace oci_nosql --query-text [text]
--query-textは、集計するメトリック・データ・ポイントを検索するときに使用するMonitoring Query Language (MQL)式です。問合せでは、メトリック、統計および間隔を指定する必要があります。intervalのサポートされる値: 1m-60m (また1h)。オプションで、ディメンションおよびグループ化関数を指定できます。サポートされているグループ化関数: groups()、groupBy()。summary-metrics-dataコマンドで使用可能なOPTIONSの詳細は、メトリック・データのサマリーを参照してください。次の例では、1分間隔でコンパートメント内の読取りユニットの合計を取得するフィルタ済メトリック問合せを作成し、単一の表にフィルタします。
たとえば:
oci monitoring metric-data summarize-metrics-data --compartment-id ocid1.compartment.oc1..aaaaaaaawrmvqjzoegxbsixp5k3b5554vlv2kxukobw3drjho3f7nf5ca3ya
--namespace oci_nosql --query-text 'ReadUnits[1m]{tableName="articles"}.sum()'
レスポンスの例:
{
"data": [
{
"aggregated-datapoints": [
{
"timestamp": "2022-02-17T11:03:00+00:00",
"value": 0.0
},
{
"timestamp": "2022-02-17T11:04:00+00:00",
"value": 0.0
},
{
"timestamp": "2022-02-17T11:05:00+00:00",
"value": 0.0
},
...
...
...
{
"timestamp": "2022-02-17T13:59:00+00:00",
"value": 0.0
},
{
"timestamp": "2022-02-17T14:00:00+00:00",
"value": 0.0
},
{
"timestamp": "2022-02-17T14:01:00+00:00",
"value": 0.0
}
],
"compartment-id": "ocid1.compartment.oc1..aaaaaaaawrmvqjzoegxbsixp5k3b5554vlv2kxukobw3drjho3f7nf5ca3ya",
"dimensions": {
"resourceId": "ocid1_nosqltable_oc1_phx_amaaaaaau7x7rfyav7f67yuj3t2q6rk7lp2a2obfdxa6hg2ho2ea7qabin4q",
"tableName": "demo"
},
"metadata": {},
"name": "ReadUnits",
"namespace": "oci_nosql",
"resolution": null,
"resource-group": null
}
]
}
アラームを作成しています
アラーム問合せを評価し、アラームが起動状態になったときに通知を送信するアラームを、他のアラーム・プロパティとともに作成できます。トリガーされると、アラームは構成されたトピック(通知)にアラーム・メッセージを送信し、そのトピックのすべてのサブスクリプションにメッセージを送信します。Slack、Email、SMSおよびPagerDutyは、通知の構成済トピックの例の一部です。
構成すると、繰返し通知により継続的に起動状態であることが構成した繰返し間隔で通知されます。アラームがOK状態に戻ったとき、またはアラームがリセットされたときにも通知されます。
アラーム問合せには、集計データを返すために評価するMonitoring Query Language (MQL)式が含まれます。問合せでは、メトリック、統計および間隔を指定する必要があります。
アラームを作成するには、次の2つの方法があります。コンソールまたはOCI CLIを使用して問合せを作成できます。
-
ナビゲーション・メニューを開き、「監視および管理」をクリックします。「モニタリング」で、「アラーム定義」をクリックします。
-
「アラームの作成」をクリックします。
ノート:「サービス・メトリック」ページで、事前定義済問合せからアラームを作成することもできます。「Options」を展開し、「Create an Alarm on this Query」をクリックします。サービス・メトリックの詳細は、「Oracle NoSQL Database Cloud Serviceメトリックの表示またはリスト」を参照してください。
-
「アラームの作成」ページの「アラームの定義」で、アラーム設定を入力または更新します。基本モードと拡張モードを切り替えるには、「拡張モードに切替え」または「基本モードに切替え」(「アラームの定義」の右側)をクリックします。
-
アラーム名:新しいアラームのわかりやすい名前。この名前は、このアラームに関連する通知のタイトルとして送信されます。機密情報を入力しないでください。
-
アラーム・サマリー:新しいアラームのわかりやすいサマリーを入力します。このフィールドはオプションです。
-
タグ(オプション):リソースを作成する権限がある場合、そのリソースにフリーフォーム・タグを適用する権限もあります。定義済タグを適用するには、タグ・ネームスペースを使用する権限が必要です。タグ付けの詳細は、リソース・タグを参照してください。タグを適用するかどうかがわからない場合は、このオプションをスキップするか(後でタグを適用できます)、管理者に問い合せてください。
ノート:ページの下部にある「拡張オプションの表示」をクリックして、「タグ」オプションにアクセスします。
-
メトリックの説明:アラーム条件について評価するメトリック。
-
コンパートメント:モニターするOracle NoSQL Database Cloud Service表を含むコンパートメント。デフォルトでは、最初にアクセス可能なコンパートメントが選択されます。
-
メトリック・ネームスペース:モニターする表のメトリックを生成するOracle NoSQL Database Cloud Service。例: oci_nosql。
-
リソース・グループ(オプション):メトリックが属するグループ。リソース・グループは、カスタム・メトリックで提供されるカスタム文字列です。サービス・メトリックには適用されません。
-
メトリック名:メトリックの名前。指定できるメトリックは1つのみです。メトリックの選択は、選択したコンパートメントとメトリック・ネームスペースによって異なります。例: ReadUnits
-
間隔:集計ウィンドウ。
-
統計:集計関数。
-
メトリック・ディメンション:評価されるメトリック・データを絞り込むためのオプション・フィルタ。
- ディメンション・フィールド: Oracle NoSQL Database Cloud Serviceメトリックの場合、ディメンション名およびディメンション値のペアとしてresourceIdまたはtableNameを選択できます。
-
-
メトリック・ストリームの集計:メトリック・チャートに1行表示して、選択した統計のメトリックは、すべて合計した値を表します。
-
トリガー・ルール:アラームが起動状態になるために満たす必要がある条件。この条件では、StorageGBに対する90%などのしきい値を指定できます。
-
演算子:条件のしきい値で使用する演算子。
-
値:条件のしきい値に使用する値。
-
トリガー遅延分数:アラームが起動状態になるまでに条件を維持する必要がある分数。維持されると、アラームが起動状態になる。
-
アラーム重大度:アラームが起動状態にあるときに必要となる、レスポンスの認識タイプ。
-
アラーム本文:配信された通知の人間が判読可能な内容。Oracleでは、アラーム状態を解決するためのガイダンスをオペレータに提供することを推奨しています。例: 「High Read Throttle Count」
-
-
-
問合せ結果のビューを変更するには、右側の結果の上にある適切なオプションをクリックします。
-
データ表を表示:データ・ポイントをリストして、それぞれのタイム・スタンプとバイト数を示します。
-
グラフを表示(デフォルト):グラフにデータ・ポイントをプロットします。
-
-
通知の設定:「通知」で、フィールドに入力します。
-
宛先:通知に使用されるトピック。
-
通知の再繰返し: アラームが起動状態になっている間、指定した間隔で通知を再送信します。
-
通知頻度: 通知の再送信を待機する期間。
-
通知 の抑制:評価および通知を一時停止する抑制時間ウィンドウを設定。システム保守期間中のアラーム通知の回避に役立ちます。
-
-
新しいアラームを無効にする場合は、「このアラームを有効にする」をクリアします
-
「アラームの保存」をクリックします。
クラウド・シェルから、次のコマンドを実行して、指定したコンパートメントに新しいアラームを作成します。コンパートメントOCIDが必要です。
oci monitoring alarm create --compartment-id <Compartment_OCID> --namespace oci_nosql --query-text [text] --destinations [complex type] --display-name [text] --is-enabled [boolean] --metric-compartment-id [text] --severity [text]
--query-textは、集計するメトリック・データ・ポイントを検索するときに使用するMonitoring Query Language (MQL)式です。問合せでは、メトリック、統計および間隔を指定する必要があります。intervalのサポートされる値: 1m-60m (また1h)。オプションで、ディメンションおよびグループ化関数を指定できます。サポートされているグループ化関数: groups()、groupBy()。アラームの作成コマンドで使用可能なオプションの詳細は、create - alarmを参照してください。次の例では、コンパートメントのStorageGBの90パーセンタイルが1分間隔で85を超え、単一の表にフィルタされた場合に、アラーム問合せでアラームを作成しています。
しきい値アラームの例:
oci monitoring alarm create --compartment-id ocid1.compartment.oc1..aaaaaaaawrmvqjzoegxbsixp5k3b5554vlv2kxukobw3drjho3f7nf5ca3ya
--namespace oci_nosql --query-text 'StorageGB[1m]{tableName="demo"}.groupBy(WriteUnits).percentile(0.9) > 85'
--display-name HighStorageConsumption --metric-compartment-id demonosql --severity Critical --is-enabled true
アラームの管理
これらのガイドラインに従って、アラームを管理できます。
-
各メトリックの一連のアラームの作成。Oracle NoSQL Database Cloud Service表によって発行されるメトリックごとに、次のリソース動作を定義するアラームを作成します。
-
リスクあり - Oracle NoSQL Database Cloud Serviceは、メトリック値で示されるとおり、動作不能になるリスクがあります。たとえば、表のストレージ・サイズの使用率が高いリスクがあります。
-
非最適 - Oracle NoSQL Database Cloud Serviceは、メトリック値で示されるように、非最適レベルで実行されています。たとえば、ReadUnitsまたはWrite Unitsは高いレイテンシを持ちます。
-
リソースが稼働中または停止中 - Oracle NoSQL Database Cloud Serviceにアクセスできないか、動作していません。たとえば、ReadThrottleCountまたはWriteThrottleCountのHigh数値です。
-
-
アラームに応答するプロセスを設定します。アラームの重大度に基づいて、次の方法でアラームに応答するように選択できます。
-
リスクありのクリティカル・アラームの場合、インスタンスを最適な運用レベルに戻すには修復が必要であるため、すぐに運用チームに通知できます。PagerDutyと電子メールの両方で、担当チームへのアラーム通知を構成し、インスタンスが動作不能状態になる前に調査と適切な修正をリクエストします。繰返し通知は1分ごとに設定します。アラーム通知に応答したら、アラームを抑制することによって、通知を一時的に停止しますメトリックが最適な値に戻ったら、抑制を削除します。
-
警告または非最適アラームの場合、Oracle NoSQL Database Cloud Service表が通常よりも多くのストレージ・サイズを消費していることを適切な個人またはチームに通知することを決定できます。ストレージ・サイズを調査して削減するための即時のアクションは必要ないため、しきい値アラームを構成して、適切な連絡先に通知します。適切な開発者またはチームへの電子メール通知のみを設定し、電子メール通知のノイズを削減するために24時間ごとに繰返し通知を送信します。
-