Solaris のシステム管理 (第 2 巻)

第 31 章 システムクラッシュ情報の生成と保存

この節では、クラッシュダンプを有効または無効にする方法と、システムメッセージを表示または収集する方法について説明します。

この章で説明する手順は次のとおりです。

システムクラッシュ情報の管理に関する新機能

この節では、Solaris 7 リリースで使用可能になった新しいシステムクラッシュダンプ機能は次のとおりです。

新しいシステムクラッシュダンプ機能

Solaris 7 のシステムクラッシュダンプ機能は、次のとおりです。

dumpadm コマンド

/usr/sbin/dumpadm コマンドは、システムのクラッシュダンプ構成パラメタを管理するコマンドです。次の表で dumpadm の構成パラメタを説明します。

ダンプパラメタ 

説明 

ダンプデバイス 

システムがクラッシュしたときにダンプデータを一時的に保存するデバイス。ダンプデバイスがスワップ領域でない場合は、savecore がバックグラウンドで実行されるため、ブートプロセスの速度が上がる

savecore ディレクトリ

システムのクラッシュダンプファイルを保存するディレクトリ 

ダンプ内容 

ダンプするデータの種類、つまりカーネルメモリーとすべてのメモリーのどちらをダンプするかを指定する  

最小空き容量 

クラッシュダンプファイルを保存した後で savecore ディレクトリに必要な最小空き容量。空き容量を指定しないと、デフォルトで 1M バイトになる

詳細は、dumpadm(1M) のマニュアルページを参照してください。

dumpadm コマンドで管理するダンプ構成パラメタは、/etc/dumpadm.conf ファイルに保存されます。


注 -

/etc/dumpadm.conf は、手作業で編集しないでください。システムダンプ構成の整合性が失われる恐れがあります。


dumpadm コマンドの動作

dumpadm コマンドは、システム起動時に /etc/init.d/savecore スクリプトによって呼び出され、/etc/dumpadm.conf ファイルの情報に基づいてクラッシュダンプパラメタの構成を行います。

このコマンドは、/dev/dump インタフェースを通してダンプデバイスとダンプ内容を初期化します。

ダンプ構成が完了すると、savecore スクリプトは、/etc/dumpadm.conf ファイルの内容を解析してクラッシュダンプファイルのディレクトリの場所を探します。次に savecore を呼び出してクラッシュダンプがあるかどうかを調べます。さらに、クラッシュダンプディレクトリにある minfree ファイルの内容も調べます。

システムクラッシュ

システムクラッシュは、ハードウェアの誤動作、入出力の障害、ソフトウェアエラーなどが原因で発生します。システムがクラッシュすると、コンソールにエラーメッセージが表示され、物理メモリーの内容がダンプデバイスに書き込まれます。その後、システムは自動的にリブートします。システムがリブートすると、savecore コマンドが実行され、ダンプデバイスからデータを取り出し、保存されているクラッシュダンプを savecore ディレクトリに書き込みます。このクラッシュダンプファイルには、問題を診断する際にサポートプロバイダにとって大変役立つ情報が含まれています。

クラッシュダンプファイル

savecore コマンドはシステムクラッシュの後で自動的に起動され、ダンプデバイスからクラッシュダンプ情報を取り出して、unix.Xvmcore.X という 1 組のファイルを作成します。X はダンプシーケンス番号です。これらのファイルには、保存されたシステムクラッシュダンプの情報が含まれます。クラッシュダンプファイルは core ファイルと混同されることがありますが、コアファイルは、アプリケーションが異常終了した場合に書き込まれるユーザーアプリケーションのイメージです。

クラッシュダンプファイルは、あらかじめ指定されているディレクトリに保存されます。デフォルトでは /var/crash/hostname です。Solaris 2.6 リリースおよび互換バージョンでは、システムが、物理メモリーのイメージをクラッシュダンプファイルに保存できるように手作業で設定されていなければ、クラッシュダンプファイルは、システムがリブートしたときに上書きされてしまいました。Solaris 7 リリースでは、デフォルトでクラッシュダンプファイルが保存されます。

クラッシュダンプの保存

制御構造体、アクティブなテーブル、動作中またはクラッシュしたシステムカーネルのメモリーのイメージなど、カーネルの動作状況についての情報を調べるには、crash または adb ユーティリティを使用します。crash または adb を完全に使いこなすには、カーネルについての詳細な知識が必要ですが、このマニュアルでは説明を省きます。crash ユーティリティの詳細は、crash(1M) または adb(1) のマニュアルページを参照してください。

savecore で保存したクラッシュダンプを購入先に送って、システムがクラッシュした原因を解析してもらうことも可能です。購入先にクラッシュダンプファイルを送る場合は、「クラッシュダンプの管理」にリストされている最初の 2 つの作業を実行してください。

クラッシュダンプの管理

表 31-1 作業マップ : クラッシュダンプの管理

作業 

説明 

手順の説明 

1. 現在のクラッシュダンプ構成を表示する  

dumpadm コマンドを使用して、現在のクラッシュダンプ構成を表示する

「現在のクラッシュダンプ構成を表示する方法」

2. クラッシュダンプ構成を変更する 

dumpadm コマンドを使用して、ダンプするデータの種類、システムが専用のダンプデバイスを使用するかどうか、クラッシュダンプファイルを保存するディレクトリ、およびコアファイルが書き込まれた後に残っていなければならない容量を指定する

「クラッシュダンプ構成を変更する方法」

3. クラッシュダンプファイルを調べる 

crash コマンドを使用して、クラッシュダンプファイルを表示する

「クラッシュダンプを検査する方法」

4. 完全なクラッシュダンプディレクトリから復元する 

(省略可能) システムがクラッシュしたが、savecore ディレクトリに空き容量がない。それでも、一部の重要なシステムクラッシュダンプ情報を保存したい

「フルクラッシュダンプディレクトリから復元する方法 (省略可能)」

5. クラッシュダンプファイルの保存を有効または無効にする 

(省略可能) dumpadm コマンドを使用して、クラッシュダンプファイルの保存を有効または無効にする。デフォルトでは、クラッシュダンプファイルは保存される

「クラッシュダンプの保存を有効または無効にする方法」

現在のクラッシュダンプ構成を表示する方法

  1. スーパーユーザーになります。

  2. dumpadm コマンドをオプションなしで実行し、現在のクラッシュダンプ構成を表示します。

    # dumpadm
          Dump content: kernel pages
           Dump device: /dev/dsk/c0t3d0s1 (swap)
    Savecore directory: /var/pluto
      Savecore enabled: yes

    上記の出力の意味は次のとおりです。

    • ダンプの内容は、カーネルメモリーページである

    • カーネルメモリーがスワップデバイス /dev/dsk/c0t3d0s1 にダンプされる。swap -l コマンドにより、すべてのスワップ領域を識別できる

    • コアファイルは /var/crash/venus ディレクトリに保存される

    • コアファイルの保存は有効に設定されている

クラッシュダンプ構成を変更する方法

  1. スーパーユーザーになります。

  2. dumpadmコマンドで、現在のクラッシュダンプ構成を確認します。

    # dumpadm
          Dump content: kernel pages
           Dump device: /dev/dsk/c0t3d0s1 (swap)
    Savecore directory: /var/crash/pluto
      Savecore enabled: yes

    上記の構成は、Solaris 7 リリースを実行するシステムのデフォルトダンプ構成です。

  3. dumpadm コマンドでクラッシュダンプ構成を変更します。

    # dumpadm -c content -d dump-device -m nnnk | nnnm | nnn% -n -s savecore-dir
    

    -c content

    ダンプするデータの種類、つまり、カーネルメモリーまたはすべてのメモリーのいずれかを指定する。デフォルトはカーネルメモリー 

    -d dump-device

    システムがクラッシュしたときに、ダンプデータを一時的に保存するデバイスを指定する。デフォルトのダンプデバイスは 1 次スワップデバイス  

    -m nnnk | nnnm | nnn%

    現在の savecore ディレクトリに minfree ファイルを作成することにより、コアファイルを保存する最小限の空き容量を指定する。このパラメタは K バイト (nnnk)、M バイト (nnnm)、またはファイルシステムサイズのパーセント (nnn%) で指定できる。savecore コマンドは、クラッシュダンプファイルを書き込む前にこのファイルを調べる。クラッシュダンプファイルを書き込むと空き容量が minfree の値より少なくなる場合、ダンプファイルは書き込まれず、エラーメッセージが記録される。このような問題を解決するには、「フルクラッシュダンプディレクトリから復元する方法 (省略可能)」を参照

    -n

    システムがリブートするときに、savecore を実行しないように指定する。このダンプ構成は推奨できない。システムクラッシュ情報がスワップデバイスに書き込まれているときに、savecore が実行されないと、クラッシュダンプ情報はシステムがスワップを開始すると上書きされる

    -s

    クラッシュダンプファイルを保存する別のディレクトリを指定する。デフォルトのディレクトリは /var/crash/hostname で、hostnameuname -n コマンドの出力

例 -クラッシュダンプ構成を変更する

次の例は、すべてのメモリーを専用のダンプデバイス /dev/dsk/c0t1d0s1 にダンプします。また、クラッシュダンプファイルを保存した後に残っていなければならない最小空き容量は、ファイルシステム容量の 10% です。

# dumpadm
      Dump content: kernel pages
       Dump device: /dev/dsk/c0t3d0s1 (swap)
Savecore directory: /var/crash/pluto
  Savecore enabled: yes
 # dumpadm -c all -d /dev/dsk/c0t1d0s1 -m 10%
      Dump content: all pages
       Dump device: /dev/dsk/c0t1d0s1 (dedicated)
Savecore directory: /var/crash/pluto (minfree = 77071KB)
  Savecore enabled: yes

クラッシュダンプを検査する方法

  1. スーパーユーザーになります。

  2. crash ユーティリティを使用して、クラッシュダンプを検査します。

    # /usr/sbin/crash [-d crashdump-file] [-n name-list] [-w output-file]

    -d crashdump-file

    システムのメモリーイメージを格納するファイルを指定する。デフォルトのクラッシュダンプファイルは /dev/mem

    -n name-list

    システムのメモリーイメージへのシンボリックアクセスを調べる場合、シンボルテーブル情報を格納するテキストファイルを指定する。デフォルトのファイル名は /dev/ksyms

    -w output-file

    クラッシュセッションからの出力を格納するファイルを指定する。デフォルトは標準出力 

  3. クラッシュ状態情報を表示します。

    # /usr/sbin/crash
    dumpfile = /dev/mem, namelist = /dev/ksyms, outfile = stdout
    > status
       .
       .
       .
    > size buf proc queue
       .
       .
       .

例 - クラッシュダンプを検査する

次の例は、crash ユーティリティからのサンプル出力を示します。状態とバッファについての情報、プロセス、および待ち行列のサイズが表示されます。

# /usr/sbin/crash
dumpfile = /dev/mem, namelist = /dev/ksyms, outfile = stdout
> status
system name:    SunOS
release:        5.7
node name:      saturn
version:        Generic
machine name:   sun4m
time of crash:  Thu Feb 26 12:17:04 1998
age of system:  19 day, 23 hr., 55 min.
panicstr:
panic registers:
        pc: 0     sp: 0
> size buf proc queue
120
1552
88

フルクラッシュダンプディレクトリから復元する方法 (省略可能)

ここでは、システムがクラッシュしてもメモリーイメージを格納する十分な空き容量が savecore ディレクトリにないが、それでも、一部の重要なシステムクラッシュダンプ情報を保存するものとします。

  1. システムがリブートした後で、スーパーユーザーとしてログインします。

  2. すでにサービスプロバイダに送ってある既存のクラッシュダンプファイルを削除して、savecore ディレクトリ (通常は /var/crash/hostname) を整理します。あるいは、savecore コマンドを実行し、十分な容量を持つ別のディレクトリを指定します (次の手順を参照してください)。

  3. 手作業で savecore コマンドを実行し、必要なら別の savecore ディレクトリを指定します。

    # savecore [ directory ]

クラッシュダンプの保存を有効または無効にする方法

  1. スーパーユーザーになります。

  2. dumpadm コマンドにより、システム上にクラッシュダンプを保存するかどうかを指定します。

例 - クラッシュダンプの保存を無効にする

次の例は、システムでのクラッシュダンプの保存を無効にします。

# dumpadm -n
      Dump content: all pages
       Dump device: /dev/dsk/c0t1d0s1 (dedicated)
Savecore directory: /var/crash/pluto (minfree = 77071KB)
  Savecore enabled: no
 

例 - クラッシュダンプの保存を有効にする

次の例は、システムでのクラッシュダンプの保存を有効にします。

# dumpadm -y
      Dump content: all pages
       Dump device: /dev/dsk/c0t1d0s1 (dedicated)
Savecore directory: /var/crash/pluto (minfree = 77071KB)
  Savecore enabled: yes