Oracle® Solaris 11.2 での障害の管理

印刷ビューの終了

更新: 2014 年 7 月
 
 

障害の統計情報

Fault Manager デーモンとそのモジュールの多くは、統計情報を収集します。fmadm config コマンドは、Fault Manager モジュールのステータスを表示します。fmstat コマンドは、これらのモジュールによって収集された統計情報を報告します。

# fmadm config
MODULE                   VERSION STATUS  DESCRIPTION
cpumem-retire            1.1     active  CPU/Memory Retire Agent
disk-diagnosis           0.1     active  Disk Diagnosis engine
disk-transport           2.1     active  Disk Transport Agent
eft                      1.16    active  eft diagnosis engine
ext-event-transport      0.2     active  External FM event transport
fabric-xlate             1.0     active  Fabric Ereport Translater
fmd-self-diagnosis       1.0     active  Fault Manager Self-Diagnosis
fru-monitor              1.1     active  FRU Monitor
io-retire                2.0     active  I/O Retire Agent
network-monitor          1.0     active  Network monitor
sensor-transport         1.2     active  Sensor Transport Agent
ses-log-transport        1.0     active  SES Log Transport Agent
software-diagnosis       0.1     active  Software Diagnosis engine
software-response        0.1     active  Software Response Agent
sysevent-transport       1.0     active  SysEvent Transport Agent
syslog-msgs              1.1     active  Syslog Messaging Agent
zfs-diagnosis            1.0     active  ZFS Diagnosis Engine
zfs-retire               1.0     active  ZFS Retire Agent

オプションを指定せずに fmstat コマンドを実行すると、ロードされたすべてのモジュールのイベント、処理時間、およびメモリー使用量の大まかな概要が表示されます。

# fmstat
module             ev_recv ev_acpt wait  svc_t    %w  %b  open solve  memsz  bufsz
cpumem-retire            0       0  0.0 10010.0    0   0     0     0      0      0
disk-diagnosis           0       0  0.0 10007.7    0   0     0     0      0      0
disk-transport           0       0  0.9 1811945.5 92   0     0     0    52b      0
eft                      0       0  0.0 4278.0     0   0     3     0   1.6M    58b
ext-event-transport      6       0  0.0  860.8     0   0     0     0    46b   2.0K
fabric-xlate             0       0  0.0    4.8     0   0     0     0      0      0
fmd-self-diagnosis     393       0  0.0   25.5     0   0     0     0      0      0
fru-monitor              2       0  0.0   42.4     0   0     0     0   880b      0
io-retire                1       0  0.0 5003.8     0   0     0     0      0      0
network-monitor          0       0  0.0   13.2     0   0     0     0   664b      0
sensor-transport         0       0  0.0   38.3     0   0     0     0    40b      0
ses-log-transport        0       0  0.0   23.8     0   0     0     0    40b      0
software-diagnosis       0       0  0.0 10010.0    0   0     0     0   316b      0
software-response        0       0  0.0 10006.8    0   0     0     0    14K    14K
sysevent-transport       0       0  0.0 6125.0     0   0     0     0      0      0
syslog-msgs              2       0  0.0 3337.2     0   0     0     0      0      0
zfs-diagnosis            4       0  0.0 2002.0     0   0     0     0      0      0
zfs-retire               4       0  0.0 2715.1     0   0     0     0     4b      0
ev_recv

そのモジュールが受け取った遠隔測定イベントの数。

ev_acpt

そのモジュールが診断に関係のあるものとして受け入れた遠隔測定イベントの数。

wait

そのモジュールによる検査を待っている遠隔測定イベントの平均数。

svc_t

そのモジュールが受け取った遠隔測定イベントの平均サービス時間 (ミリ秒単位)。

%w

遠隔測定イベントがそのモジュールによる検査を待っていた時間の割合。

%b

そのモジュールが遠隔測定イベントを処理していた時間の割合。

open

そのモジュールが所有するアクティブなケース (未完了の問題調査) の数。open 列は、診断エンジンでのみ作成および解決される障害管理のケースにのみ適用されます。この列は、応答エージェントなどのほかのモジュールには適用されません。

solve

そのモジュールが読み込み後に解決したケースの合計数。solve 列は、診断エンジンでのみ作成および解決される障害管理のケースにのみ適用されます。この列は、応答エージェントなどのほかのモジュールには適用されません。

memsz

そのモジュールによって現在割り当てられている動的メモリーの量。

bufsz

そのモジュールによって現在割り当てられている永続バッファー領域の量。

各種オプションを指定すると、さまざまな統計情報および列が表示されます。

個々のモジュールに関する統計情報を表示するには、-m module オプションを使用します。-z オプションは、値がゼロの統計情報を抑止します。次の例は、cpumem-retire という応答エージェントによって CPU をオフラインにするリクエストが正常に処理されたことを示しています。

# fmstat -z -m cpumem-retire
  NAME      VALUE        DESCRIPTION
  cpu_flts  1            cpu faults resolved

ほかのオプションについては、fmstat(1M) のマニュアルページを参照してください。