アービタ・ノードの監視
アービタ・ノードは、古いマスターが使用できなくなったときに新しいマスターの選択に参加する軽量プロセスです。詳細は、概要マニュアルのアービタ・ノードを参照してください。
次の項を参照してください。
アービタ・ノードのメトリック
-
arbNodeServiceStatus – アービタ・ノードの現在のステータス。次のものがあります。
-
starting (1) – ストレージ・ノード・エージェントはブート中です。
-
waitingForDeploy (2) – アービタ・ノードはストレージ・ノード・エージェントへの登録を待機しています。
-
running(3) – アービタ・ノードは実行中です。
-
stopping(4) – アービタ・ノードはシャットダウンのプロセス中です。
-
stopped(5) – 意図的なクリーン・シャットダウンです。
-
errorRestarting(6) – エラー発生後にアービタ・ノードが再起動しています。
-
errorNoRestart(7) – サービスはエラー状態で、自動的に再起動されません。管理介入が必要です。ユーザーは、サービスのログ・ファイルと、障害が発生したサービスを制御でしているSNAのログ・ファイルの両方でSEVEREエントリを検索できます。「Monitoring for Arbiter」セクションにあるサービスのログがアービタ・ログです。
<kvroot>/<storename>/log/rg*_an1_*.log
ここで、<kvroot>および<storename>はユーザー入力で、*はログの番号を表します。
kvrootとstorenameはすべてのインストールで異なることに注意してください。同様に、SNAのログ・ファイルを検索するには、次を使用します。
SNログの例としては、sn1_0.log、sn1_1.logなどがあります。<kvroot>/<storename>/log/sn*_*.log
これらのログ・ファイルでSEVEREキーワードを検索し、検索したメッセージを読んでエラーを修正するか、必要に応じてOracle NoSQL Databaseサポートに支援を求めることができます。対応策は障害の性質によって異なります。また、サービスを明示的に停止して再起動するという簡単な場合もあれば、サービス・インスタンスを完全に置き換える必要があるという困難で時間がかかる場合もあります。次のいずれかの問題が考えられます。-
リソースの問題 - ディスク領域、メモリー、ネットワークなど、必要なリソースの一部が使用できません。
-
構成の問題 - 修正が必要な構成関連の問題があります。
-
ソフトウェアのバグ – Oracle NoSQL Databaseサポートを必要とする不具合がコード内にあります。
-
ディスク上の破損 - 永続ストレージの何かが破損しています。
破損することは稀ですが、その状況が起こった場合は対処が困難であり、Oracle NoSQL Databaseサポートの支援を受ける必要があります。
-
-
unreachable(8) – 管理サービスがアービタ・ノードにアクセスできません。
ノート:
ストレージ・ノードがUNREACHABLEであるか、または管理ノードに問題があり、そのストレージ・ノードがUNREACHABLEである場合、最初に確認するのは、管理ノードとストレージ・ノード間のネットワーク接続です。ただし、管理側のストレージ・ノード・エージェントがアクセス可能で、管理対象のアービタ・ノードがアクセス不可の場合、ネットワークには問題がなく、問題は他にあると考えられます。
-
expectedRestarting(9) – アービタ・ノードで予期された再起動が実行されています。plan CLIコマンドの中にはコンポーネントの再起動を必要とするものがあるためです。この再起動は、errorRestarting(6) (エラー発生後の再起動)とは異なり、予期されたものです。
ノート:
すべてのタイムスタンプ・メトリックはUTCであるため、ストアのデプロイ先に関連するタイム・ゾーンに適切に変換する必要があります。
-
-
arbNodeConfigProperties – 現在実行中のアービタ・ノードで使用されている構成名/値ペアのセット。これは、レプリケーション・ノードに類似しています。
-
arbNodeJavaMiscParams – このアービタ・ノードを実行しているJava VMのブート時に検出された-Xms、-Xmxおよび-XX:ParallelGCThreads=の値。
-
arbNodeLoggingConfigProps – このアービタ・ノードを実行しているJava VMのブート時に検出されたloggingConfigPropsパラメータの値。
-
arbNodeCollectEnvStats – アービタ・ノードで現在パフォーマンス統計が収集されているかどうかを示す値(trueまたはfalse)。
-
arbNodeStatsInterval – アービタ・ノードで統計の集計に使用されている間隔(秒)。
-
arbNodeHeapMB – このアービタ・ノードのJavaヒープのサイズ(MB)。
-
arbNodeAcks – 受信確認されたトランザクションの数。
-
arbNodeMaster – 現在のマスター。
-
arbNodeState – ノードのレプリケーション状態。アービタには、レプリケーション状態(レプリケーション・ノードの状態に類似)が関連付けられています。状態図はUNKNOWN <-> REPLICA -> DETACHEDです。
-
arbNodeVLSN – 現在の受信確認済VLSN。アービタでは、そのアービタによって受信確認されたトランザクション・コミットのVLSN/DTVLSNが追跡されます。これは、アービタによって受信確認された最上位のVLSN値です。
-
arbNodeReplayQueueOverflow – 現在のreplayQueueOverflow値。arbNodeReplayQueueOverflow統計は、アービタでの受信確認リクエストの処理速度が不十分であり、キュー内に空き領域が生じるまでネットワークからのスレッドの読取りが抑制される場合に増分されます。RepParms.REPLICA_MESSAGE_QUEUE_SIZEは、キューに保持できるエントリの最大数を指定するために使用します。デフォルトは1000エントリです。arbNodeReplayQueueOverflowの値が大きい場合は、キュー・サイズが小さすぎるか、アービタでのリクエストの処理速度が不十分であり、システム・ロードを処理できていない可能性があります。