Solaris のシステム管理 (上級編)

システムクラッシュの問題の解決

Oracle Solaris OS が動作しているシステムがクラッシュした場合は、クラッシュダンプファイルを含む、可能なかぎりの情報を購入先に提供してください。

システムがクラッシュした場合の対処方法

もっとも重要なことは、次のとおりです。

  1. システムのコンソールメッセージを書き取ります。

    システムがクラッシュした場合は、システムを再稼動させるのを最優先に考えがちです。しかし、システムをリブートする前に、コンソール画面のメッセージを確認してください。 これらのメッセージは、クラッシュした原因を解明するのに役立ちます。システムが自動的にリブートして、コンソールメッセージが画面から消えた場合でも、システムエラーログファイル /var/adm/messages を表示すれば、これらのメッセージをチェックできます。システムエラーログファイルを表示する方法については、「システムメッセージを表示する方法」を参照してください。

    クラッシュが頻繁に発生し、その原因を特定できない場合は、システムコンソールまたは /var/adm/messages ファイルからできるだけ多くの情報を収集し、購入先に問い合わせます。購入先に問い合わせるために収集しておく問題解決情報の完全なリストについては、「システムクラッシュの問題の解決」を参照してください。

    システムクラッシュ後に、リブートが失敗する場合は、第 18 章ソフトウェアで発生するさまざまな問題の解決 (手順)を参照してください。

  2. 次のように入力してディスクとの同期をとり、リブートします。


    ok sync
    

    システムクラッシュ後に、リブートが失敗する場合は、第 18 章ソフトウェアで発生するさまざまな問題の解決 (手順)を参照してください。

また、システムクラッシュダンプがシステムのクラッシュ後に生成されたかどうかを確認してください。デフォルトでは、システムクラッシュダンプが保存されます。クラッシュダンプについては、第 17 章システムクラッシュ情報の管理 (手順)を参照してください。

問題の解決に使用するデータの収集

システムの問題を特定するために、次の質問に答えてください。「システムクラッシュを解決するためのチェックリスト」を使用し、クラッシュしたシステムの問題解決データを収集します。

表 14–1 システムクラッシュに関するデータの収集

質問 

説明 

問題を再現できるか

この質問は、再現可能なテストケースは実際のハードウェア問題をデバッグするために重要であることが多いために重要である。購入先では、特殊な計測機構を使用してカーネルを構築して問題を再現し、バグを引き起こし、診断、および修正できる 

Sun 以外のドライバを使用しているか

ドライバは、カーネルと同じアドレス空間で、カーネルと同じ特権で動作する。したがって、ドライバにバグがあると、システムクラッシュの原因となることがある 

クラッシュの直前にシステムは何を実行していたか

システムが通常でないこと (新しい負荷テストの実行など) を行なったり、通常よりも高い負荷がシステムにかかったりした場合、クラッシュの原因となることがある 

クラッシュ直前に、異常なコンソールメッセージが表示されたか

システムがクラッシュする前には、なんらかの兆候を示していることがある。この情報は重要 

/etc/system ファイルに調整パラメータを追加したか

調整パラメータは、システムクラッシュの原因となることがある。たとえば、共有メモリーセグメントを増やした結果、システムが限度以上の多くのメモリーを割り当てようとした 

問題は最近発生するようになったか

そうであれば、問題の原因は、システムの変更 (たとえば、新しいドライバ、新しいソフトウェア、作業負荷の変化、CPU のアップグレード、メモリーのアップグレードなど) にある可能性がある