管理ノードの監視

管理ノードは、ストレージ・ノードで実行されるプロセスであり、ストア・コンポーネントの構成、デプロイ、監視および変更に使用されます。管理ノードでは、管理コマンドライン・インタフェース(CLI)からのコマンドの実行が処理されます。詳細は、概要マニュアル管理を参照してください。

次の項を参照してください。

管理ノードのメトリック

Oracle NoSQL Databaseクラスタの管理ノードを監視するためにJMXから次のメトリックにアクセスできます。

  • adminId 管理ノードの一意のID。

  • adminServiceStatus 管理サービスのステータス。次のいずれかになります。

    • unreachable(0) 管理ノードにアクセスできません。ネットワーク・エラーが発生したか、管理ノードが停止している可能性があります。

    • starting (1) 管理ノード・エージェントはブート中です。

    • waitingForDeploy (2) 構成されていない、つまりストア名が指定されていないブートストラップ管理を示します。管理を構成すると、管理データベースの作成がトリガーされ、そのステータスが「WAITING_FOR_DEPLOY」から「RUNNING」に変更されます。

    • running(3) 管理ノードは実行中です。

    • stopping(4) 管理ノードはシャットダウンのプロセス中です。

    • stopped(5) 管理ノードの意図的なクリーン・シャットダウンです。

    • errorRestarting(6) ストレージ・ノードにより管理の起動が複数回試みられましたが、成功しないため中断されました。

    • errorNoRestart(7) サービスはエラー状態で、自動的に再起動されません。管理介入が必要です。ユーザーは、サービスのログ・ファイルと、障害が発生したサービスを制御しているSNAのログ・ファイルの両方でSEVEREエントリを検索できます。「Monitoring for Admin」セクションにあるサービスのログが管理ログです。

      <kvroot>/<storename>/log/admin*_*.log

      ここで、<kvroot>および<storename>はユーザー入力で、*はログの番号を表します。

      kvrootとstorenameはすべてのインストールで異なることに注意してください。同様に、SNAのログ・ファイルを検索するには、次を使用します。

      <kvroot>/<storename>/log/sn*_*.log
      SNログの例としては、sn1_0.log、sn1_1.logなどがあります。
      これらのログ・ファイルでSEVEREキーワードを検索し、検索したメッセージを読んでエラーを修正するか、必要に応じてOracle NoSQL Databaseサポートに支援を求めることができます。対応策は障害の性質によって異なります。また、サービスを明示的に停止して再起動するという簡単な場合もあれば、サービス・インスタンスを完全に置き換える必要があるという困難で時間がかかる場合もあります。次のいずれかの問題が考えられます。
      • リソースの問題 - ディスク領域、メモリー、ネットワークなど、必要なリソースの一部が使用できません。

      • 構成の問題 - 修正が必要な構成関連の問題があります。

      • ソフトウェアのバグ – Oracle NoSQL Databaseサポートを必要とする不具合がコード内にあります。

      • ディスク上の破損 - 永続ストレージの何かが破損しています。

      稀なケースとしてディスクの破損を発見した場合は、Oracle NoSQL Databaseサポートの支援を受ける必要があります。

    • expectedRestarting(9) 管理ノードで予期された再起動が実行されています。plan CLIコマンドの中にはコンポーネントの再起動を必要とするものがあるためです。この再起動は、errorRestarting(6) (エラー発生後の再起動)とは異なり、予期されたものです。

  • adminLogFileCount 管理ノードによって保持されるログ・ファイルの最大数を表すロギング構成パラメータ。デバッグ・ログ・ファイルによって消費されるディスク領域を削減する場合は、このパラメータの値およびadminLogFileLimitパラメータを変更します。保存されたデバッグ・ログ・データの量を削減するために、問題に気付く前にデバッグ情報を削除してしまった場合、問題のデバッグが困難になる可能性があります。adminLogFileCountの詳細は、管理パラメータおよび管理再起動を参照してください。

  • adminLogFileLimit 単一のログ・ファイルの最大サイズ(バイト)を表すロギング構成パラメータ。adminLogFileLimitの詳細は、管理パラメータおよび管理再起動を参照してください。

  • adminPollPeriod 管理によって統計のためにエージェント(レプリケーション・ノードおよびストレージ・ノード・エージェント)がポーリングされる頻度。このポーリングでは、サービス・ステータスの変更、パフォーマンス・メトリックおよびログ・メッセージが取得されます。この期間はミリ秒単位でレポートされます。

  • adminEventExpiryAge クリティカル・イベントが管理データベースに保存される期間を指示します。この値は時間単位でレポートされます。

  • adminIsMaster この管理ノードが管理グループのマスター・ノードであるかどうかを示すブール値。