この章では、Solaris 環境でシステムクラッシュ情報を管理する方法を説明します。
システムクラッシュ情報の管理に関連する手順については、「システムクラッシュ情報 (作業マップ)」を参照してください。
次の作業マップは、システムクラッシュ情報の管理に必要な手順を示します。
作業 |
説明 |
参照先 |
---|---|---|
1. 現在のクラッシュダンプ構成を表示する |
dumpadm コマンドを使用して、現在のクラッシュダンプ構成を表示する | |
2. クラッシュダンプ構成を変更する |
dumpadm コマンドを使用して、ダンプするデータの種類、システムが専用のダンプデバイスを使用するかどうか、クラッシュダンプファイルを保存するディレクトリ、およびクラッシュダンプファイルが書き込まれた後に残っていなければならない容量を指定する | |
3. クラッシュダンプファイルを調べる |
mdb コマンドを使用して、クラッシュダンプファイルを表示する | |
4. (省略可能) クラッシュダンプディレクトリが一杯になった場合に復元する |
システムがクラッシュした際にメモリーイメージを格納する十分な空き容量が savecore ディレクトリになくても、一部の重要なシステムクラッシュダンプ情報を保存したい場合。 | |
5. (省略可能) クラッシュダンプファイルの保存を有効または無効にする |
dumpadm コマンドを使用して、クラッシュダンプファイルの保存を有効または無効にする。デフォルトでは、クラッシュダンプファイルは保存される |
ハードウェアの障害、入出力の問題、ソフトウェアエラーなどが原因でシステムがクラッシュすることがあります。システムがクラッシュすると、システムはエラーメッセージをコンソールに表示し、物理メモリーのコピーをダンプデバイスに書き込みます。その後、システムは自動的にリブートします。システムがリブートすると、savecore コマンドが実行され、ダンプデバイスのデータを取り出して保存されたクラッシュダンプを savecore ディレクトリに書き込みます。このクラッシュダンプファイルは、サポートプロバイダにとって、問題を診断する上で貴重な情報となります。
システムクラッシュの後で自動的に実行される savecore コマンドは、ダンプデバイスからクラッシュダンプ情報を取り出し、unix.X と vmcore.X という 1 対のファイルを作成します。X はダンプの通し番号です。これらのファイルは 2 つで、保存されたシステムクラッシュダンプの情報を表します。
クラッシュダンプファイルはコアファイルと混同されることがあります。コアファイルは、アプリケーションが異常終了したときに書き込まれるユーザーアプリケーションのイメージです。
クラッシュダンプファイルは、あらかじめ決められたディレクトリに保存されます。これはデフォルトでは /var/crash/hostname です。以前の Solaris リリースでは、システムを手動で有効にして物理メモリーのイメージをクラッシュダンプファイルに保存しない限り、システムがリブートされた時にクラッシュダンプファイルが上書きされていました。このリリースでは、クラッシュダンプファイルの保存がデフォルトで有効です。
システムクラッシュ情報は dumpadm コマンドで管理します。詳細は、「dumpadm コマンド」を参照してください。
制御構造体、アクティブなテーブル、動作中またはクラッシュしたシステムカーネルのメモリーのイメージなど、カーネルの動作状況についての情報を調べるには、mdb ユーティリティを使用します。mdb を完全に使いこなすには、カーネルについての詳細な知識が必要ですが、このマニュアルでは説明を省きます。このユーティリティについては、mdb(1M) のマニュアルページを参照してください。
savecore で保存したクラッシュダンプを購入先に送って、システムがクラッシュした原因を解析してもらうことも可能です。
dumpadm コマンドを使用して、Solaris 環境でシステムクラッシュダンプ情報を管理します。
オペレーティングシステムのクラッシュダンプを構成することもできます。dumpadm 構成パラメータでは、ダンプ内容、ダンプデバイス、クラッシュダンプファイルが保存されるディレクトリなどを指定します。
ダンプデータは、圧縮した形式でダンプデバイスに格納されます。カーネルのクラッシュダンプイメージは 4G バイトを超える場合があります。データを圧縮することにより、ダンプが速くなり、ダンプデバイスのディスク領域も少なくてすみます。
スワップ領域ではなく、専用のダンプデバイスがダンプ構成の一部にあると、クラッシュダンプファイルの保存はバックグラウンドで行われます。つまり、システムを起動する際、savecore コマンドが完了するのを待たなくても、次の段階に進むことができます。大容量のメモリーを搭載したシステムでは、savecore コマンドが完了する前にシステムが使用可能になります。
savecore コマンドで生成されるシステムクラッシュダンプファイルは、デフォルトで保存されます。
savecore -L コマンドは、動作中の Solaris オペレーティング環境でクラッシュダンプを取得できる新しい機能です。たとえば、パフォーマンスに問題が発生しているときやサービスが停止しているときなどにメモリーのスナップショットをとって、実行中のシステムの問題を解決するのに使用します。システムが実行中で、一部のコマンドがまだ使用できる場合は、savecore -L コマンドを使用してシステムのスナップショットをダンプデバイスに保存し、クラッシュダンプファイルをただちに savecore ディレクトリに書き込むことができます。システムが実行中であるため、専用のダンプデバイスを構成してある場合のみ、savecore -L コマンドを使用できます。
ダンプパラメータ |
説明 |
---|---|
ダンプデバイス |
システムがクラッシュしたときにダンプデータを一時的に保存するデバイス。ダンプデバイスがスワップ領域でない場合は、savecore がバックグラウンドで実行されるため、ブートプロセスの速度が上がる |
savecore ディレクトリ |
システムのクラッシュダンプファイルを保存するディレクトリ |
ダンプ内容 |
ダンプするデータの種類、つまりカーネルメモリーとすべてのメモリーのどちらをダンプするかを指定する |
最小空き容量 |
クラッシュダンプファイルを保存した後で savecore ディレクトリに必要な最小空き容量。空き容量を指定しないと、デフォルトで 1M バイトになる |
詳細については、dumpadm(1M) のマニュアルページを参照してください。
dumpadm コマンドで管理するダンプ構成パラメータは、/etc/dumpadm.conf ファイルに保存されます。
/etc/dumpadm.conf は、手作業で編集しないでください。システムダンプ構成の整合性が失われる恐れがあります。
dumpadm コマンドは、システム起動時に /etc/init.d/savecore スクリプトによって呼び出され、/etc/dumpadm.conf ファイルの情報に基づいてクラッシュダンプパラメータの構成を行います。
このコマンドは、/dev/dump インタフェースを通してダンプデバイスとダンプ内容を初期化します。
ダンプ構成が完了すると、savecore スクリプトは、/etc/dumpadm.conf ファイルの内容を解析してクラッシュダンプファイルのディレクトリの場所を探します。次に savecore を呼び出してクラッシュダンプがあるかどうかを調べます。さらに、クラッシュダンプディレクトリにある minfree ファイルの内容も調べます。
可用性とパフォーマンス上の理由のため、Solaris ボリュームマネージャーで管理されている専用ダンプデバイスを構成しないでください。スワップ領域を Solaris ボリュームマネージャーの管理下に置くことはできますが (この方法を推奨します)、ダンプデバイスは別に確保してください。
システムクラッシュ情報を処理する場合には、次の点に注意してください。
システムクラッシュ情報にアクセスして管理するには、スーパーユーザーでログインする必要があります。
システムクラッシュダンプを保存するオプションを無効にしないでください。システムクラッシュファイルにより、システムクラッシュの原因を判断する非常に有効な方法が提供されます。
また、重要なシステムクラッシュ情報は、カスタマサービス担当者に送信するまでは削除しないでください。
現在のクラッシュダンプ構成を表示します。
# dumpadm Dump content: kernel pages Dump device: /dev/dsk/c0t3d0s1 (swap) Savecore directory: /var/pluto Savecore enabled: yes |
ダンプの内容は、カーネルメモリーページである
カーネルメモリーがスワップデバイス /dev/dsk/c0t3d0s1 にダンプされる。swap -l コマンドにより、すべてのスワップ領域を識別できる
システムクラッシュダンプファイルは /var/crash/venus ディレクトリに保存される
システムクラッシュダンプファイルの保存は有効に設定されている
現在のクラッシュダンプ構成を確認します。
# dumpadm Dump content: kernel pages Dump device: /dev/dsk/c0t3d0s1 (swap) Savecore directory: /var/crash/pluto Savecore enabled: yes |
上記の構成は、Solaris 9 リリースを実行するシステムのデフォルトダンプ構成です。
クラッシュダンプ構成を変更します。
# dumpadm -c content -d dump-device -m nnnk | nnnm | nnn% -n -s savecore-dir |
-c content |
ダンプするデータの種類を指定する。すべてのカーネルメモリーをダンプするには kernel を、すべてのメモリーをダンプするには all を使用する。デフォルトはカーネルメモリー |
-d dump-device |
システムがクラッシュしたときに、ダンプデータを一時的に保存するデバイスを指定する。デフォルトのダンプデバイスは 1 次スワップデバイス |
-m nnnk | nnnm | nnn% |
現在の savecore ディレクトリに minfree ファイルを作成することにより、クラッシュダンプファイルを保存する最小限の空き容量を指定する。このパラメータは K バイト (nnnk)、M バイト (nnnm)、またはファイルシステムサイズのパーセント (nnn%) で指定できる。savecore コマンドは、クラッシュダンプファイルを書き込む前にこのファイルを調べる。クラッシュダンプファイルを書き込むと空き容量が minfree の値より少なくなる場合、ダンプファイルは書き込まれず、エラーメッセージが記録される。このような問題を解決するには、「クラッシュダンプディレクトリが一杯になった場合に復元する方法 (省略可能)」を参照 |
-n |
システムがリブートするときに、savecore を実行しないように指定する。このダンプ構成は推奨できない。システムクラッシュ情報がスワップデバイスに書き込まれているときに、savecore が実行されないと、クラッシュダンプ情報はシステムがスワップを開始すると上書きされる |
-s |
クラッシュダンプファイルを保存する別のディレクトリを指定する。デフォルトのディレクトリは /var/crash/hostname で、hostname は uname -n コマンドの出力 |
次の例は、すべてのメモリーを専用のダンプデバイス /dev/dsk/c0t1d0s1 にダンプします。また、クラッシュダンプファイルを保存した後に残っていなければならない最小空き容量は、ファイルシステム容量の 10% です。
# dumpadm Dump content: kernel pages Dump device: /dev/dsk/c0t3d0s1 (swap) Savecore directory: /var/crash/pluto Savecore enabled: yes # dumpadm -c all -d /dev/dsk/c0t1d0s1 -m 10% Dump content: all pages Dump device: /dev/dsk/c0t1d0s1 (dedicated) Savecore directory: /var/crash/pluto (minfree = 77071KB) Savecore enabled: yes |
スーパーユーザーになります。
mdb ユーティリティを使用して、クラッシュダンプを検査します。
# /usr/bin/mdb [-k] crashdump-file |
-k |
オペレーティングシステムのクラッシュダンプファイルの場合のカーネルデバッグモードを指定します。 |
crashdump-file |
オペレーティングシステムのクラッシュダンプファイルを指定します。 |
クラッシュ状態情報を表示します。
# /usr/bin/mdb file-name > ::status . . . > ::system . . . |
次の例は、mdb ユーティリティからのサンプル出力を示します。このシステムのシステム情報と /etc/system ファイルに設定される調整可能パラメータが表示されます。
# /usr/bin/mdb -k unix.0 Loading modules: [ unix krtld genunix ip nfs ipc ptm ] > ::status debugging crash dump /dev/mem (64-bit) from ozlo operating system: 5.9 Generic (sun4u) > ::system set ufs_ninode=0x9c40 [0t40000] set ncsize=0x4e20 [0t20000] set pt_cnt=0x400 [0t1024] |
ここでは、システムがクラッシュしてもメモリーイメージを格納する十分な空き容量が savecore ディレクトリにないが、それでも、一部の重要なシステムクラッシュダンプ情報を保存したい場合を考えます。
システムがリブートした後で、スーパーユーザーとしてログインします。
すでにサービスプロバイダに送ってある既存のクラッシュダンプファイルを削除して、savecore ディレクトリ (通常は /var/crash/hostname) を整理します。あるいは、savecore コマンドを実行し、十分な容量を持つ別のディレクトリを指定します (次の手順を参照してください)。
手作業で savecore コマンドを実行し、必要なら別の savecore ディレクトリを指定します。
# savecore [ directory ] |
次の例は、システムでのクラッシュダンプの保存を無効にします。
# dumpadm -n Dump content: all pages Dump device: /dev/dsk/c0t1d0s1 (dedicated) Savecore directory: /var/crash/pluto (minfree = 77071KB) Savecore enabled: no |
次の例は、システムでのクラッシュダンプの保存を有効にします。
# dumpadm -y Dump content: all pages Dump device: /dev/dsk/c0t1d0s1 (dedicated) Savecore directory: /var/crash/pluto (minfree = 77071KB) Savecore enabled: yes |