アービタ・ノードのモニタリング
アービタ・ノードは、古いマスターが使用不可になったときに新しいマスターの選択に参加する軽量プロセスです。詳細は、Oracle NoSQL Database概要マニュアルのアービタ・ノードの項を参照してください。
次の項を参照してください。
メトリック
-
arbNodeServiceStatus – アービタ・ノードの現在のステータス。これらは次のとおりです。
-
starting(1) – ストレージ・ノード・エージェントが起動中です。
-
waitingForDeploy (2) – アービタ・ノードがストレージ・ノード・エージェントへの登録を待機しています。
-
running(3) – アービタ・ノードが実行中です。
-
stopping(4) – アービタ・ノードがシャットダウン処理中です。
-
stopped(5) – 意図的な正常なシャットダウン。
-
errorRestarting(6) – エラー発生後にアービタ・ノードが再起動しています。
-
errorNoRestart(7) – サービスはエラー状態で、自動的には再起動されません。管理介入が必要です。ユーザーは、サービスのログ・ファイルと失敗したサービスを制御するSNAのログ・ファイルの両方で、SEVEREエントリの検索を開始できます。アービタのモニタリング・セクション内のサービスのログは、アービタ・ログです。
<kvroot>/<storename>/log/rg*_an1_*.log
ここで、<kvroot>および<storename>はユーザー入力で、*はログの番号を表します。
kvrootとstorenameは、すべてのインストールで異なることに注意してください。同様に、SNAのログ・ファイルを検索するには、次を使用します。
SNログの例として、sn1_0.log、sn1_1.logなどがあります。<kvroot>/<storename>/log/sn*_*.log
これらのログ・ファイルでSEVEREキーワードを検索し、検索したメッセージを読んでエラーを修正することも、Oracle NoSQL Databaseサポートから支援を受けることもできます。実行するアクションは、障害の性質によって決まります。また、サービスを明示的に停止および再起動する場合 (簡単) から、サービス・インスタンスを完全に置き換える必要がある場合 (簡単ではなく時間がかかります) によって異なります。次のような問題が起こる場合があります。-
リソースの問題 – ディスク領域、メモリー、ネットワークなどの必要なリソースのタイプの一部が使用できません。
-
構成の問題 – 修正が必要な構成関連の問題があります。
-
ソフトウェアのバグ – コードにバグがあり、Oracle NoSQL Databaseサポートが必要です。
-
ディスク破損時 – 永続ストレージの一部が破損しています。
破損の状況は処理が困難ですが、そのような状況はまれで、Oracle NoSQL Databaseサポートによる支援が必要です。
-
-
unreachable(8) – 管理サービスがアービタ・ノードにアクセスできません。
注意:
ストレージ・ノードがUNREACHABLEであるか、または管理ノードに問題があり、そのストレージ・ノードがUNREACHABLEである場合、最初に確認するのは、管理ノードとストレージ・ノード間のネットワーク接続です。ただし、管理しているストレージ・ノード・エージェントがアクセス可能で、管理対象のアービタ・ノードがアクセス不可の場合、ネットワークには問題がないと考えられ、問題は他にあることになります。
-
expectedRestarting(9) – 一部の計画CLIコマンドが原因でコンポーネントが再起動されるため、予期される再起動がアービタ・ノードによって実行されています。これは予期された再起動で、errorRestarting(6) (エラー発生後の再起動)とは異なります。
注意:
すべてのタイムスタンプ・メトリックはUTCにあるため、ストアのデプロイ先に関連するタイムゾーンに適切に変換する必要があります。
-
-
arbNodeConfigProperties – アービタ・ノードが現在実行している構成名/値のペアのセット。これは、レプリケーション・ノードと類似しています。
-
arbNodeJavaMiscParams – このアービタ・ノードを実行しているJava VMが起動したときに発生した-Xms、-Xmx、および-XX:ParallelGCThreads=の値。
-
arbNodeLoggingConfigProps – このアービタ・ノードを実行しているJava VMが起動したときに発生したloggingConfigPropsパラメータの値。
-
arbNodeCollectEnvStats – アービタ・ノードが現在パフォーマンス統計を収集しているかどうかに応じたtrueまたはfalse。
-
arbNodeStatsInterval – アービタ・ノードが集計統計のために利用している間隔(秒)。
-
arbNodeHeapMB – このアービタ・ノードのJavaヒープのサイズ(MB)。
-
arbNodeAcks – 確認されたトランザクションの数。
-
arbNodeMaster – 現在のマスター。
-
arbNodeState - ノードのレプリケーションの状態。アービタには、レプリケーションの状態(レプリケーション・ノードの状態に類似)が関連付けられています。状態図はUNKNOWN <-> REPLICA -> DETACHEDです。
-
arbNodeVLSN – 現在の確認済VLSN。アービタは、アービタが確認するトランザクション・コミットのVLSN/DTVLSNを追跡します。これは、アービタが確認した最上位のVLSN値です。
-
arbNodeReplayQueueOverflow – 現在のreplayQueueOverflow値。arbNodeReplayQueueOverflow統計は、アービタが確認要求を十分迅速に処理できない場合に増分され、スレッドがネットワークから読み込んでからキュー内の領域が空くのを待機することがないようにします。RepParms.REPLICA_MESSAGE_QUEUE_SIZEは、キューに保持できるエントリの最大数を指定するために使用します。デフォルトは1000エントリです。arbNodeReplayQueueOverflowの値が大きい場合は、キュー・サイズが小さすぎるか、システム・ロードに求められる速さでアービタが要求を処理できないことを示している可能性があります。