アービタ・ノードの監視

アービタ・ノードは、古いマスターが使用できなくなったときに新しいマスターの選択に参加する軽量プロセスです。詳細は、概要マニュアルアービタ・ノードを参照してください。

次の項を参照してください。

アービタ・ノードのメトリック

  • arbNodeServiceStatus アービタ・ノードの現在のステータス。次のものがあります。

    • starting (1) ストレージ・ノード・エージェントはブート中です。

    • waitingForDeploy (2) アービタ・ノードはストレージ・ノード・エージェントへの登録を待機しています。

    • running(3) アービタ・ノードは実行中です。

    • stopping(4) アービタ・ノードはシャットダウンのプロセス中です。

    • stopped(5) 意図的なクリーン・シャットダウンです。

    • errorRestarting(6) エラー発生後にアービタ・ノードが再起動しています。

    • errorNoRestart(7) サービスはエラー状態で、自動的に再起動されません。管理介入が必要です。ユーザーは、サービスのログ・ファイルと、障害が発生したサービスを制御でしているSNAのログ・ファイルの両方でSEVEREエントリを検索できます。「Monitoring for Arbiter」セクションにあるサービスのログがアービタ・ログです。

      <kvroot>/<storename>/log/rg*_an1_*.log

      ここで、<kvroot>および<storename>はユーザー入力で、*はログの番号を表します。

      kvrootとstorenameはすべてのインストールで異なることに注意してください。同様に、SNAのログ・ファイルを検索するには、次を使用します。
      <kvroot>/<storename>/log/sn*_*.log
      SNログの例としては、sn1_0.log、sn1_1.logなどがあります。
      これらのログ・ファイルでSEVEREキーワードを検索し、検索したメッセージを読んでエラーを修正するか、必要に応じてOracle NoSQL Databaseサポートに支援を求めることができます。対応策は障害の性質によって異なります。また、サービスを明示的に停止して再起動するという簡単な場合もあれば、サービス・インスタンスを完全に置き換える必要があるという困難で時間がかかる場合もあります。次のいずれかの問題が考えられます。
      • リソースの問題 - ディスク領域、メモリー、ネットワークなど、必要なリソースの一部が使用できません。

      • 構成の問題 - 修正が必要な構成関連の問題があります。

      • ソフトウェアのバグ – Oracle NoSQL Databaseサポートを必要とする不具合がコード内にあります。

      • ディスク上の破損 - 永続ストレージの何かが破損しています。

      破損することは稀ですが、その状況が起こった場合は対処が困難であり、Oracle NoSQL Databaseサポートの支援を受ける必要があります。

    • unreachable(8) 管理サービスがアービタ・ノードにアクセスできません。

      注意:

      ストレージ・ノードがUNREACHABLEであるか、または管理ノードに問題があり、そのストレージ・ノードがUNREACHABLEである場合、最初に確認するのは、管理ノードとストレージ・ノード間のネットワーク接続です。ただし、管理側のストレージ・ノード・エージェントがアクセス可能で、管理対象のアービタ・ノードがアクセス不可の場合、ネットワークには問題がなく、問題は他にあると考えられます。

    • expectedRestarting(9) アービタ・ノードで予期された再起動が実行されています。plan CLIコマンドの中にはコンポーネントの再起動を必要とするものがあるためです。この再起動は、errorRestarting(6) (エラー発生後の再起動)とは異なり、予期されたものです。

    注意:

    すべてのタイムスタンプ・メトリックはUTCであるため、ストアのデプロイ先に関連するタイム・ゾーンに適切に変換する必要があります。

  • arbNodeConfigProperties 現在実行中のアービタ・ノードで使用されている構成名/値ペアのセット。これは、レプリケーション・ノードに類似しています。

  • arbNodeJavaMiscParams このアービタ・ノードを実行しているJava VMのブート時に検出された-Xms、-Xmxおよび-XX:ParallelGCThreads=の値。

  • arbNodeLoggingConfigProps このアービタ・ノードを実行しているJava VMのブート時に検出されたloggingConfigPropsパラメータの値。

  • arbNodeCollectEnvStats アービタ・ノードで現在パフォーマンス統計が収集されているかどうかを示す値(trueまたはfalse)。

  • arbNodeStatsInterval アービタ・ノードで統計の集計に使用されている間隔(秒)。

  • arbNodeHeapMB このアービタ・ノードのJavaヒープのサイズ(MB)。

  • arbNodeAcks 受信確認されたトランザクションの数。

  • arbNodeMaster 現在のマスター。

  • arbNodeState ノードのレプリケーション状態。アービタには、レプリケーション状態(レプリケーション・ノードの状態に類似)が関連付けられています。状態図はUNKNOWN <-> REPLICA -> DETACHEDです。

  • arbNodeVLSN 現在の受信確認済VLSN。アービタでは、そのアービタによって受信確認されたトランザクション・コミットのVLSN/DTVLSNが追跡されます。これは、アービタによって受信確認された最上位のVLSN値です。

  • arbNodeReplayQueueOverflow 現在のreplayQueueOverflow値。arbNodeReplayQueueOverflow統計は、アービタでの受信確認リクエストの処理速度が不十分であり、キュー内に空き領域が生じるまでネットワークからのスレッドの読取りが抑制される場合に増分されます。RepParms.REPLICA_MESSAGE_QUEUE_SIZEは、キューに保持できるエントリの最大数を指定するために使用します。デフォルトは1000エントリです。arbNodeReplayQueueOverflowの値が大きい場合は、キュー・サイズが小さすぎるか、アービタでのリクエストの処理速度が不十分であり、システム・ロードを処理できていない可能性があります。