Solstice DiskSuite 4.2.1 ユーザーズガイド

メタデバイスとホットスペア集合の状態のチェック方法 (コマンド行)

前提条件 (「DiskSuite オブジェクトを保守するための前提条件」) を満たしていることを確認します。metastat(1M) コマンドを使用して、メタデバイスやホットスペア集合の状態を表示します。詳細については、metastat(1M) のマニュアルページを参照してください。

コマンド行の出力と実行可能な操作の説明は、次のリストを使用して、適切なページを参照してください。


注 -

DiskSuite の一般的な状態キーワードの説明については、表 3-2 を参照してください。


ストライプと連結の状態 (コマンド行)

連結またはストライプがサブミラーとして使用されない限り、DiskSuite は連結またはストライプの状態変化を通知しません。詳細については、「ストライプと連結の状態 (DiskSuite ツール)」を参照してください。

ミラーとサブミラーの状態 (コマンド行)

ミラー上で metastat(1M) を実行すると、各サブミラーの状態、パス番号、読み取りオプション、書き込みオプション、ミラー内の総ブロック数サイズが表示されます。ミラーのパス番号、読み取りオプション、書き込みオプションを変更するには、「ミラーのオプションの変更方法 (コマンド行)」を参照してください。

metastat から出力されたミラーの例を次に示します。


# metastat
d0: Mirror
    Submirror 0: d1
      State: Okay        
    Submirror 1: d2
      State: Okay        
    Pass: 1
    Read option: roundrobin (default)
    Write option: parallel (default)
    Size: 5600 blocks
 
d1: Submirror of d0
    State: Okay        
    Size: 5600 blocks
    Stripe 0:
        Device              Start Block  Dbase State        Hot Spare
        c0t2d0s7                   0     No    Okay        
 
...

ミラー内の各サブミラーに対して、metastat は、その状態、呼び出し (Invoke) 行 (エラーがある場合)、割り当てられたホットスペア集合 (もしあれば)、ブロック単位のサイズ、サブミラー内の各スライスについての情報を表示します。

サブミラーの状態を表 3-8 に示します。

表 3-8 サブミラーの状態 (コマンド行)

状態 

意味 

Okay 

サブミラーにはエラーがなく、正しく機能しています。 

Resyncing 

サブミラーは、アクティブに再同期されています。エラーが発生して訂正されました。サブミラーがちょうどオンラインに復帰したか、または新しいサブミラーが追加されました。 

Needs Maintenance 

サブミラー内のスライスに、入出力エラーまたはオープンエラーが発生しました。サブミラー内のこのスライスに対するすべての読み書きは中止されました。 

さらに、サブミラー内のストライプごとに、metastat は、ストライプ内のスライスのデバイス名 (Device)、スライスが始まる開始ブロック (Start Block)、スライスに状態データベースの複製が含まれるかどうか (Dbase)、スライスの状態 (Status)、障害の発生したスライスのホットスペアに使用されるスライスを示すホットスペア (Hot Spare) を表示します。

ミラーのエラーを解決する場合、おそらくこのスライス状態は最も重要な情報となります。サブミラー状態は、「Okay (正常)」や「Needs Maintenance (要保守)」などの一般的な状態情報を提供するだけです。サブミラーが「Needs Maintenance」状態を通知した場合、スライス状態を参照してください。スライスが「Maintenance (保守状態)」または「Last Erred (最後にエラーが発生した状態)」にある場合、別の障害回復アクションを実行することになります。「Maintenance」のスライスだけが存在する場合、これらのスライスは任意の順序で修復できます。「Maintenance」のスライスと「Last Erred」スライスが存在する場合、最初に「Maintenance」のスライスを修復してから、「Last Erred」スライスを修復しなければなりません。詳細は、「ミラーと RAID5 メタデバイスにおけるスライスの交換と有効化の概要」を参照してください。

サブミラーのスライス状態と実行可能な操作を表 3-9 に示します。

表 3-9 サブミラーのスライス状態 (コマンド行)

状態 

意味 

操作 

Okay 

スライスにはエラーがなく、正常に機能しています。 

ありません。 

Resyncing 

サブミラーの再同期処理が活発に行われています。エラーの発見、訂正処理を行なっていたり、サブミラーがオンライン状態に復帰した直後、または新たにサブミラーが追加された状態です。 

必要ならば、再同期が終了するまで、サブミラーの状態を監視します。 

Maintenance 

スライスに入出力エラーまたはオープンエラーが発生しました。このスライスとの読み書きはすべて中止されました。 

エラーの発生したスライスを有効にするか交換します。「サブミラー内のスライスを有効にする方法 (コマンド行)」、または 「サブミラー内のスライスを交換する方法 (コマンド行)」を参照してください。

注 : metastat(1M) コマンドでは、 metareplace(1M) コマンドで実行すべき適切な操作と一緒に、invoke 障害回復メッセージを表示します。 metareplace -e コマンドも使用できます。

Last Erred 

スライスに入出力エラーまたはオープンエラーが発生しました。しかし、他のスライスにも障害が発生しているため、データは他の場所に複写されません。スライス上では、まだ入出力が実行中です。この入出力がエラーになると、ミラー入出力は異常終了します。 

最初に、「保守状態」のスライスを有効にするか交換します。「サブミラー内のスライスを有効にする方法 (コマンド行)」、または 「サブミラー内のスライスを交換する方法 (コマンド行)」を参照してください。通常、このエラーによって一部のデータが失われるため、修復してからミラーの妥当性をチェックします。ファイルシステムの場合、fsck(1M) コマンドを使用して「メタデータ」の妥当性をチェックしてから、ユーザーデータをチェックします。アプリケーションやデータベースには、メタデータの妥当性をチェックするための独自の方法が必要です。

RAID5 メタデバイスの状態 (コマンド行)

RAID5 メタデバイス上で metastat(1M) コマンドを実行すると、メタデバイスの状態が表示されます。さらに、RAID5 メタデバイス内のスライスごとに、 metastat は、ストライプ内のスライスのデバイス名 (Device)、スライスが始まる開始ブロック (Start Block)、スライスに状態データベースの複製が含まれるかどうか (Dbase)、スライスの状態 (Status)、障害の発生したスライスのホットスペアに使用されるスライスを示すホットスペア (Hot Spare) を表示します。

metastat から出力された RAID5 メタデバイスの例を次に示します。


# metastat
d10: RAID
    State: Okay        
    Interlace: 32 blocks
    Size: 10080 blocks
Original device:
    Size: 10496 blocks
        Device              Start Block  Dbase State        Hot Spare
        c0t0d0s1                 330     No    Okay        
        c1t2d0s1                 330     No    Okay        
        c2t3d0s1                 330     No    Okay 

RAID5 メタデバイスの状態を表 3-10 に示します。

表 3-10 RAID5 の状態 (コマンド行)

状態 

意味 

Initializing 

スライスは、すべてのディスクブロックをゼロで初期化操作中にあります。この操作は、データとパリティを飛び越しストライピングする RAID5 メタデバイスの特性上、必要なものです。 

 

状態が「Okay (正常)」に変化したら、初期化プロセスが完了しており、デバイスを開くことができます。それまで、アプリケーションはエラーメッセージを受け取ります。 

Okay 

デバイスの使用準備が整っており、今のところエラーはありません。 

Maintenance 

読み書き操作中に発生した入出力エラーかオープンエラーが発生したため、1 つのスライスがエラーとマークされました。 

RAID5 メタデバイスのエラーに対処する場合、おそらくこのスライス状態は最も重要な情報となります。RAID5 状態は、「Okay (正常)」や「Needs Maintenance (要保守)」などの一般的な状態情報を提供するだけです。RAID5 が「Needs Maintenance」状態を通知した場合、スライス状態を参照してください。スライスが「Maintenance (保守状態)」または「Last Erred (最後にエラーが発生した状態)」にある場合、別の障害回復操作を実行することになります。「Maintenance」のスライスが 1 つだけ存在する場合、そのスライスはデータを失うことなく修復できます。「Maintenance」のスライスと「Last Erred」のスライスが存在する場合、データはおそらく破壊されています。最初に「Maintenance」のスライスを修復してから、「Last Erred」のスライスを修復しなければなりません。詳細は、「ミラーと RAID5 メタデバイスにおけるスライスの交換と有効化の概要」を参照してください。

RAID5 メタデバイスのスライス状態と実行可能な操作を、表 3-11 に示します。

表 3-11 RAID5 のスライス状態 (コマンド行)

状態 

意味 

操作 

Initializing 

スライスは、すべてのディスクブロックをゼロで初期化操作中にあります。この操作は、データとパリティを飛び越しストライピングする RAID5 メタデバイスの特性上、必要なものです。 

通常は、ありません。このプロセス中に入出力エラーが発生した場合、デバイスは「Maintenance (保守状態)」となります。初期化に失敗した場合、メタデバイスは「初期化失敗状態」となり、スライスは「Maintenance」となります。この場合、メタデバイスを削除して再作成します。 

Okay 

デバイスの使用準備が整っており、今のところエラーはありません。 

ありません。必要ならば、スライスの追加や交換が行えます。 

Resyncing 

スライスの再同期処理が活発に行われています。エラーの発見、訂正処理を行なっていたり、スライスがオンライン状態に復帰した直後、または新たにスライスが追加された状態です。 

希望により、再同期が完了するまで、RAID5 メタデバイスの状態を監視します。 

Maintenance 

読み書き操作中に発生した入出力エラーやオープンエラーが発生したため、1 つのスライスにエラーがマークされました。 

エラーの発生したスライスを有効にするか交換します。「RAID5 メタデバイス内のスライスを有効にする方法 (コマンド行)」、または 「RAID5 スライスの交換方法 (コマンド行)」を参照してください。

注 : metastat(1M) コマンドでは、 metareplace(1M) コマンドで実行すべき適切な操作と一緒に、invoke 障害回復メッセージを表示します。

Last Erred 

複数のスライスにエラーが発生しました。エラーの発生したスライスの状態は、「Maintenance」か「Last Erred」です。この状態では、「Maintenance」にあるスライスには入出力が行われないが、「Last Erred」とマークされたスライスには入出力が試され、その結果入出力要求の状態は全体的にこの状態 (Last Erred) となります。 

エラーの発生したスライスを有効にするか交換します。「RAID5 メタデバイス内のスライスを有効にする方法 (コマンド行)」、または 「RAID5 スライスの交換方法 (コマンド行)」を参照してください。

注 : metastat(1M) コマンドを起動すると、metareplace(1M) コマンドに適切なオプション (-f フラグ) を付けて実行するように表示されます。つまり、複数のエラースライスから正確でないデータが生成された可能性があることを示します。

トランスメタデバイスの状態 (コマンド行)

トランスメタデバイス上で metastat(1M) コマンドを実行すると、メタデバイスの状態が表示されます。

metastat から出力されたトランスメタデバイスの例を次に示します。


# metastat
d20: Trans
    State: Okay        
    Size: 102816 blocks
    Master Device: c0t3d0s4
    Logging Device: c0t2d0s3
 
        Master Device       Start Block  Dbase
        c0t3d0s4                   0     No  
 
c0t2d0s3: Logging device for d0
    State: Okay        
    Size: 5350 blocks
 
        Logging Device      Start Block  Dbase
        c0t2d0s3                 250     No 

metastat コマンドは、マスターデバイスとロギングデバイスも表示します。デバイスごとに次の情報が表示されます。スライスまたはメタデバイスのデバイス名 (Device)、デバイスが始まる開始ブロック (Start Block)、デバイスに状態データベースの複製が含まれるかどうか (Dbase)、ロギングデバイス用の状態 (State)。

トランスメタデバイスの状態と実行可能な操作を表 3-12 に示します。

表 3-12 トランスメタデバイスの状態 (コマンド行)

状態 

意味 

操作 

Okay 

デバイスは正しく機能しています。マウントされているものの場合、ファイルシステムはロギングされているので、ブート時のチェックはありません。 

ありません。 

Attaching 

トランスが閉じられたりマウント解除されたとき、ロギングデバイスがトランスメタデバイスに接続されます。そのとき、デバイスは「Okay (正常)」状態に移行します。 

metattach(1M) のマニュアルページを参照してください。

Detached 

トランスメタデバイスにはロギングデバイスがありません。UFS ロギングの利点が無効になります。 

fsck(1M) は、デバイスをブート時に自動的にチェックします。 metadetach(1M) のマニュアルページを参照してください。

Detaching 

トランスが閉じられたりマウント解除されたとき、ロギングデバイスはトランスメタデバイスから切断されます。そのとき、デバイスは「Detached (切断)」状態に移行します。 

metadetach(1M) のマニュアルページを参照してください。

Hard Error 

デバイスの使用中に、デバイスエラーやファイルシステムのパニックが発生しました。デバイスが閉じられるかマウント解除されるまで、読み書きのたびに入出力エラーが返されます。最初に開いた時点で、デバイスは「Error (エラー)」状態に移行します。 

トランスメタデバイスを修復します。 「ファイルシステムのパニックを起こしたトランスメタデバイスの回復方法 (コマンド行)」、または 「ハードエラーを起こしたトランスメタデバイスの回復方法 (コマンド行)」を参照してください。

Error 

デバイスは読み書き可能です。ファイルシステムも読み取り専用でマウントできるのに、実際に読み書きしてみるとそのつど入出力エラーが返されています。この状態からは、たとえファイルシステムでパニックが発生したり、デバイスエラーが発生しても、ハードエラー状態には戻りません。 

トランスメタデバイスを修復します。 「ファイルシステムのパニックを起こしたトランスメタデバイスの回復方法 (コマンド行)」、または 「ハードエラーを起こしたトランスメタデバイスの回復方法 (コマンド行)」を参照してください。 fsck(1M) または newfs(1M) が正常に終了すると、デバイスは「Okay」状態に移行します。デバイスが「Hard Error」または「Error」の状態にある場合、fsck はファイルシステムをブート時に自動的にチェックおよび修復します。newfs は、デバイスにどんなデータがあっても、これを破壊します。

ホットスペア集合とホットスペアの状態 (コマンド行)

ホットスペア集合上で metastat(1M) コマンドを実行すると、ホットスペア集合とそのホットスペアの状態が表示されます。

metastat から出力されたホットスペア集合の例を次に示します。


# metastat hsp001
hsp001: 1 hot spare
        c1t3d0s2                Available       16800 blocks

ホットスペア集合の状態と実行可能な操作を表 3-13 に示します。

表 3-13 ホットスペア集合の状態 (コマンド行)

状態 

意味 

操作 

Available 

ホットスペアは動作中であり、データを受け付ける用意ができているが、現在のところ読み書きが行われていません。 

ありません。 

In-use 

現在、ホットスペアを使用して読み書きが行われています。 

ホットスペアの使用状況を診断してから、ホットスペアが使用されているメタデバイス内のスライスを修復します。 

Attention 

ホットスペアまたはホットスペア集合に障害がありますが、すぐにデータが消失する危険はありません。ホットスペア集合にホットスペアが存在しない場合、またはすべてのホットスペアが使用中であるか壊れているホットスペアがある場合にも、この状態になります。 

ホットスペアの使用状況や故障原因を診断します。必要ならば、ホットスペア集合にホットスペアを追加できます。