アービタ・ノードのモニタリング

アービタ・ノードは、古いマスターが使用不可になったときに新しいマスターの選択に参加する軽量プロセスです。詳細は、Oracle NoSQL Database概要マニュアルアービタ・ノードの項を参照してください。

次の項を参照してください。

メトリック

  • arbNodeServiceStatus アービタ・ノードの現在のステータス。これらは次のとおりです。

    • starting(1) ストレージ・ノード・エージェントが起動中です。

    • waitingForDeploy (2) アービタ・ノードがストレージ・ノード・エージェントへの登録を待機しています。

    • running(3) アービタ・ノードが実行中です。

    • stopping(4) アービタ・ノードがシャットダウン処理中です。

    • stopped(5) 意図的な正常なシャットダウン。

    • errorRestarting(6) エラー発生後にアービタ・ノードが再起動しています。

    • errorNoRestart(7) サービスはエラー状態で、自動的には再起動されません。管理介入が必要です。ユーザーは、サービスのログ・ファイルと失敗したサービスを制御するSNAのログ・ファイルの両方で、SEVEREエントリの検索を開始できます。アービタのモニタリング・セクション内のサービスのログは、アービタ・ログです。

      <kvroot>/<storename>/log/rg*_an1_*.log

      ここで、<kvroot>および<storename>はユーザー入力で、*はログの番号を表します。

      kvrootとstorenameは、すべてのインストールで異なることに注意してください。同様に、SNAのログ・ファイルを検索するには、次を使用します。
      <kvroot>/<storename>/log/sn*_*.log
      SNログの例として、sn1_0.log、sn1_1.logなどがあります。
      これらのログ・ファイルでSEVEREキーワードを検索し、検索したメッセージを読んでエラーを修正することも、Oracle NoSQL Databaseサポートから支援を受けることもできます。実行するアクションは、障害の性質によって決まります。また、サービスを明示的に停止および再起動する場合 (簡単) から、サービス・インスタンスを完全に置き換える必要がある場合 (簡単ではなく時間がかかります) によって異なります。次のような問題が起こる場合があります。
      • リソースの問題 – ディスク領域、メモリー、ネットワークなどの必要なリソースのタイプの一部が使用できません。

      • 構成の問題 – 修正が必要な構成関連の問題があります。

      • ソフトウェアのバグ – コードにバグがあり、Oracle NoSQL Databaseサポートが必要です。

      • ディスク破損時 – 永続ストレージの一部が破損しています。

      破損の状況は処理が困難ですが、そのような状況はまれで、Oracle NoSQL Databaseサポートによる支援が必要です。

    • unreachable(8) 管理サービスがアービタ・ノードにアクセスできません。

      注意:

      ストレージ・ノードがUNREACHABLEであるか、または管理ノードに問題があり、そのストレージ・ノードがUNREACHABLEである場合、最初に確認するのは、管理ノードとストレージ・ノード間のネットワーク接続です。ただし、管理しているストレージ・ノード・エージェントがアクセス可能で、管理対象のアービタ・ノードがアクセス不可の場合、ネットワークには問題がないと考えられ、問題は他にあることになります。

    • expectedRestarting(9) 一部の計画CLIコマンドが原因でコンポーネントが再起動されるため、予期される再起動がアービタ・ノードによって実行されています。これは予期された再起動で、errorRestarting(6) (エラー発生後の再起動)とは異なります。

    注意:

    すべてのタイムスタンプ・メトリックはUTCにあるため、ストアのデプロイ先に関連するタイムゾーンに適切に変換する必要があります。

  • arbNodeConfigProperties アービタ・ノードが現在実行している構成名/値のペアのセット。これは、レプリケーション・ノードと類似しています。

  • arbNodeJavaMiscParams このアービタ・ノードを実行しているJava VMが起動したときに発生した-Xms、-Xmx、および-XX:ParallelGCThreads=の値。

  • arbNodeLoggingConfigProps このアービタ・ノードを実行しているJava VMが起動したときに発生したloggingConfigPropsパラメータの値。

  • arbNodeCollectEnvStats アービタ・ノードが現在パフォーマンス統計を収集しているかどうかに応じたtrueまたはfalse。

  • arbNodeStatsInterval アービタ・ノードが集計統計のために利用している間隔(秒)。

  • arbNodeHeapMB このアービタ・ノードのJavaヒープのサイズ(MB)。

  • arbNodeAcks 確認されたトランザクションの数。

  • arbNodeMaster 現在のマスター。

  • arbNodeState - ノードのレプリケーションの状態。アービタには、レプリケーションの状態(レプリケーション・ノードの状態に類似)が関連付けられています。状態図はUNKNOWN <-> REPLICA -> DETACHEDです。

  • arbNodeVLSN 現在の確認済VLSN。アービタは、アービタが確認するトランザクション・コミットのVLSN/DTVLSNを追跡します。これは、アービタが確認した最上位のVLSN値です。

  • arbNodeReplayQueueOverflow 現在のreplayQueueOverflow値。arbNodeReplayQueueOverflow統計は、アービタが確認要求を十分迅速に処理できない場合に増分され、スレッドがネットワークから読み込んでからキュー内の領域が空くのを待機することがないようにします。RepParms.REPLICA_MESSAGE_QUEUE_SIZEは、キューに保持できるエントリの最大数を指定するために使用します。デフォルトは1000エントリです。arbNodeReplayQueueOverflowの値が大きい場合は、キュー・サイズが小さすぎるか、システム・ロードに求められる速さでアービタが要求を処理できないことを示している可能性があります。