Solstice DiskSuite 4.2.1 ユーザーズガイド

DiskSuite オブジェクトの状態チェック

この節では、状態データベースの複製、メタデバイス、ホットスペア、ディスクセットなど、DiskSuite オブジェクトの状態をチェックする作業について説明します。この章で後述する次のような作業を実行する前に、オブジェクトの状態をチェックしてください。

DiskSuite ツールによる状態のチェック

DiskSuite ツールを使用して DiskSuite オブジェクトの状態をチェックするには、次の 3 とおりの方法があります。

コマンド行による状態のチェック

metadb(1M) と metastat(1M) という 2 つのコマンドで、DiskSuite オブジェクトの状態をチェックします。


# metadb [-s <セット名>] [-i]

このコマンドでは、

-s <セット名>metadb コマンドが作用するディスクセットの名前を指定します。
-i 状態フラグについて説明する凡例を表示します。


# metastat [-s <セット名>] [-p] [-t] [<オブジェクト>]

このコマンドでは、

-s <セット名>

metastat が作用するディスクセットの名前を指定します。

-p

md.tab ファイルと同じ形式で状態を表示します。

-t

最後に状態が変化した時間を表示します。 

<オブジェクト> 

ストライプ、連結、ストライプ方式の連結、ミラー、RAID5 メタデバイス、トランスメタデバイス、またはホットスペア集合の名前。具体的なオブジェクトを省略した場合、すべてのメタデバイスとホットスペア集合の状態が表示されます。 

状態データベースの複製の状態のチェック方法 (DiskSuite ツール)

  1. 前提条件 (「DiskSuite オブジェクトを保守するための前提条件」) を満たしていることを確認する。

  2. オブジェクトの「情報」ウィンドウを表示して、MetaDB オブジェクトの状態をチェックする。

    その他の方法で状態をチェックするには、「DiskSuite ツールによる状態のチェック」を参照してください。

  3. 表 3-1 のMetaDB オブジェクトの状態フィールド、および実行可能な操作の説明を参照する。

    表 3-1 MetaDB オブジェクトの状態キーワード

    キーワード 

    意味 

    操作 

    正常 

    MetaDB オブジェクト (状態データベース) にはエラーがなく、正しく機能しています。

    ありません。 

    注意 

    正常な状態データベースの複製の数が 3 未満であるか、または少なくとも 1 つの複製が壊れています。 

     

    この状態は、メタデバイスの状態データベースの複製が 3 つ未満の異なるコントローラ上で作成された場合にも表示されます。 

    さらに複製を追加する (できれば異なるコントローラに分散) か、または壊れた複製を修復します。 

     

    可能ならば別のコントローラを追加し、新しいコントローラに接続されたドライブ上に状態データベースの複製を作成します。 

     

    状態データベースの複製を追加するには、「状態データベースの追加複製を作成する方法 (DiskSuite ツール)」を参照してください。壊れた複製を修復するには、「状態データベースの複製を有効にする方法 (DiskSuite ツール)」を参照してください。

    緊急 

    正常な状態データベースの複製の数が 2 未満であるか、または 1 つ以上の状態データベースの複製が壊れています。 

    さらに複製を追加する (できれば異なるコントローラに分散) か、または壊れた複製を修復します。 

     

    状態データベースの複製を追加するには、「状態データベースの追加複製を作成する方法 (DiskSuite ツール)」を参照してください。壊れた複製を修復するには、「状態データベースの複製を有効にする方法 (DiskSuite ツール)」を参照してください。

    重大な障害 

    正常な状態データベースの複製が存在しません。 

    状態データベースの複製を最初から少なくとも 3 つ作成してリブートします。さもなければ、システムは正しくブートできません。「初期状態データベースの複製を最初から作成する方法 (DiskSuite ツール)」を参照してください。

状態データベースの複製の状態のチェック方法 (コマンド行)

「DiskSuite オブジェクトを保守するための前提条件」の前提条件をチェックしてから、-i オプションを付けて metadb(1M) コマンド使用して、状態データベースの複製の状態を表示します。詳細については、metadb(1M) のマニュアルページを参照してください。

例 - すべての状態データベースの複製の状態をチェック


# metadb -i
        flags           first blk       block count
     a        u         16              1034            /dev/dsk/c4t3d0s2
     a        u         16              1034            /dev/dsk/c3t3d0s2
     a        u         16              1034            /dev/dsk/c2t3d0s2
 o - state database replica active prior to last mddb configuration change
 u - state database replica is up to date
 l - locator for this state database replica was read successfully
 c - state database replica's location was in /etc/opt/SUNWmd/mddb.cf
 p - state database replica's location was patched in kernel
 m - state database replica is master, this is state database replica
     selected as input
 W - state database replica has device write errors
 a - state database replica is active, commits are occurring to this
     state database replica
 M - state database replica had problem with master blocks
 D - state database replica had problem with data blocks
 F - state database replica had format problems
 S - state database replica is too small to hold current data base
 R - state database replica had device read errors

デバイス名の前にある文字は、状態を表わします。この例での状態データベースの複製は、a フラグで示されるように、すべて有効です。状態に続いて、すべてのフラグの凡例が表示されます。

大文字は障害状態を示します。小文字は正常状態を示します。

メタデバイスとホットスペア集合の状態のチェック方法 (DiskSuite ツール)

この作業は、メタデバイスとホットスペア集合の状態情報を表示および解釈するために使用します。

  1. 前提条件 (「DiskSuite オブジェクトを保守するための前提条件」) を満足していることを確認する。

  2. オブジェクトの「情報」ウィンドウを表示することによって、メタデバイスやホットスペア集合の状態をチェックする。

    その他の状態チェック方法については、「DiskSuite ツールによる状態のチェック」を参照してください。

  3. 表 3-2 のメタデバイスとホットスペア集合によって使用される状態キーワードの説明を参照する。

    表 3-2 一般的な状態キーワード

    キーワード 

    意味 

    使用するもの 

    正常 

    メタデバイスまたはホットスペア集合にはエラーがなく、正しく機能しています。 

    すべての種類のメタデバイスとホットスペア集合 

    注意 

    メタデバイスまたはホットスペア集合には障害があるが、すぐにデータが消失する危険はありません。 

    すべての種類のメタデバイスとホットスペア集合 

    緊急 

    メタデバイスにあと 1 つ障害が発生したらデータが消失します。 

    ミラー / サブミラー、RAID5 メタデバイス、トランスメタデバイス 

    重大な障害 

    データが破壊された可能性があります。たとえば、ミラー内のすべてのサブミラーにエラーがあったり、RAID5 メタデバイスの複数のスライスにエラーがあります。メタデバイスの構成が無効である場合、テンプレートオブジェクト (ホットスペア集合テンプレートを除く) も重大な障害状態を示します。 

    ミラー / サブミラー、RAID5 メタデバイス、トランスメタデバイス、すべてのテンプレートオブジェクト 


    注 -

    SPARCstorage Array のファンに障害が発生した場合、その SPARCstorage Array 上のすべてのメタデバイスとスライスに「重大な障害」のマークが付けられます。


  4. 次のリストから、DiskSuite オブジェクトの具体的な状態と実行可能な操作についての説明を探し、参照する。

ストライプと連結の状態 (DiskSuite ツール)

連結またはストライプがサブミラーとして使用されていない限り、DiskSuite は、エラーの発生した連結やストライプの状態変化を通知しません。スライスエラーやその他のデバイス障害がある場合、DiskSuite は、要求側のアプリケーションにエラーを返し、それを次のようにコンソールに出力します。


WARNING: md d4: read error on /dev/dsk/c1t3d0s6

注 -

DiskSuite は、SNMP メッセージを受信できる任意のネットワーク管理コンソールに対して、上のメッセージのような SNMP トラップデータ (警告) を送信できます。詳細は、「DiskSuite の SNMP サポートの構成方法 (コマンド行)」を参照してください。


連結とストライプには複製データが含まれないため、シンプルメタデバイスでのスライスエラーから回復するためには、物理ディスクを交換し、メタデバイスを再作成してデータをバックアップから復元する必要があります。「スライス障害の後でストライプや連結を再作成する方法 (DiskSuite ツール)」、または 「スライス障害の後でストライプや連結を再作成する方法 (コマンド行)」を参照してください。

ミラーとサブミラーの状態 (DiskSuite ツール)

ミラーオブジェクトには 2 つの状態フィールドがあります。つまり、ミラーデバイス自身の状態フィールドと、各サブミラー用の個々の状態フィールドです。ミラー用の状態フィールドは、表 3-3 で示すような状態を提供します。

表 3-3 ミラーの状態キーワード

キーワード 

意味 

正常 

ミラーにはエラーがなく、正しく機能しています。 

注意 

サブミラーには障害がありますが、すぐにデータが消失する危険はありません。データのコピーがまだ 2 つある (このミラーは 3 面ミラーであり、1 つのサブミラーだけに障害が発生した) か、またはホットスペアによって交換された状態にあります。 

緊急 

ミラーには正常なサブミラーが 1 つしかなく、データのコピー 1 つだけでサービスを提供しています。この 1 つ残ったミラーに障害が発生したらデータが消失します。 

重大な障害 

すべてのサブミラーにエラーがあり、データが破壊された可能性があります。 

サブミラーの状態フィールドと実行可能な操作を表 3-4 に示します。

表 3-4 サブミラーの状態キーワード

キーワード 

意味 

操作 

正常 

サブミラーにはエラーがなく、正しく機能しています。 

ありません。 

再同期中 

サブミラーの再同期処理が活発に行われています。 

ありません。エラーの発見、訂正処理を行なっていたり、サブミラーがオンライン状態に復帰した直後、または新たにサブミラーが追加された状態です。 

コンポーネント再同期 

サブミラー内のスライスの再同期処理が活発に行われています。 

ありません。ホットスペアスライスまたは他のスライスを利用して、サブミラー内のエラーの発生したスライスを交換しました。 

接続中 

サブミラーが接続されています。 

ありません。 

接続済み (再同期中) 

接続後、サブミラー全体を再同期しています。 

ありません。 

オンライン(予定設定済み) 

次に「確定」をクリックすると、サブミラーがオンラインとなります。 

「確定」をクリックして、サブミラーを有効にします。 

オフライン(予定設定済み) 

次に「確定」をクリックすると、サブミラーはオフラインとなります。 

「確定」をクリックして、サブミラーをオフラインにします。 

オフライン済み 

サブミラーはオフラインです。 

たとえば保守を行なった後など、適当なときに、サブミラーをオンラインに戻します。「サブミラーのオフライン / オンライン設定 (DiskSuite ツール)」を参照してください。

保守状態 

サブミラーにはエラーがあります。 

サブミラーを修復します。「エラー」状態にあるサブミラーは任意の順序で修復できます。「サブミラー内のスライスを有効にする方法 (DiskSuite ツール)」、または 「サブミラー内のスライスを交換する方法 (DiskSuite ツール)」を参照してください。

最後にエラーが 発生した状態 

サブミラーにエラーがあり、ミラーのデータは破壊された可能性があります。 

まず、「保守状態」のサブミラーを修復してから、「最後にエラーが発生した状態」のサブミラーを修復します。「サブミラー内のスライスを有効にする方法 (DiskSuite ツール)」、または 「サブミラー内のスライスを交換する方法 (DiskSuite ツール)」を参照してください。エラーを修復したら、データの妥当性チェックします。


注 -

DiskSuite は、サブミラーではないシンプルメタデバイスに対して、状態情報やホットスペア情報を保持しません。


RAID5 メタデバイスの状態 (DiskSuite ツール)

RAID5 オブジェクトの状態フィールドにあるキーワード、および実行可能な操作について、表 3-5 で説明します。

表 3-5 RAID5 の状態キーワード

キーワード 

意味 

操作 

正常 

RAID5 メタデバイスにはエラーがなく、正しく機能しています。 

ありません。 

接続済み / 初期化 (再同期) 

接続が行われた後、または作成された後で、RAID5 メタデバイスが再同期されています。 

通常は、ありません。入出力エラーが発生した場合、新しい RAID5 メタデバイスの初期化中に、デバイスは「保守状態」となります。初期化に失敗した場合、メタデバイスは「初期化失敗状態」となり、スライスは「保守状態」となります。この場合、メタデバイスを削除して再作成します。 

注意 

RAID5 メタデバイスに障害はありますが、すぐにデータが消失する危険はありません。 

デバイス状態の監視を続けます。 

緊急 

RAID5 メタデバイスにはスライスエラーがあり、あと 1 つ障害が発生したらデータが消失します。 

エラーの発生したスライスを修復します。「RAID5 メタデバイス内のスライスを有効にする方法 (DiskSuite ツール)」、または 「RAID5 スライスの交換方法 (DiskSuite ツール)」を参照してください。

重大な障害 

RAID5 メタデバイスには、エラーのあるスライスが複数個存在します。データは破壊された可能性があります。 

エラーの発生したスライスを修復するには、「RAID5 メタデバイス内のスライスを有効にする方法 (DiskSuite ツール)」、または 「RAID5 スライスの交換方法 (DiskSuite ツール)」を参照してください。バックアップからデータを復元する必要があります。

トランスメタデバイスの状態 (DiskSuite ツール)

トランスメタデバイスオブジェクトの状態フィールドのキーワード、および実行可能な操作について、表 3-6 で説明します。

表 3-6 トランスメタデバイスの状態キーワード

キーワード 

意味 

操作 

正常 

デバイスは正しく機能しています。マウントされている場合、ファイルシステムはロギング中なので、ブート時にはチェックされません (つまり、fsck はブート時にファイルシステムをチェックしません)。

ありません。 

ログの切断 (進行中) 

トランスメタデバイスがマウント解除されたとき、または次のリブート時に、トランスメタデバイスのログが切断されます。 

ありません。 

ログの切断 (予定設定済み) 

次に「確定」をクリックすると、トランスメタデバイスのログが切断されます。 

「確定」をクリックしてログを切断します。この切断は、次のリブート時、またはファイルシステムがマウント解除されてから再マウントされたときに行われます。 

注意 

トランスメタデバイスには障害がありますが、すぐにデータが消失する危険はありません。 

トランスメタデバイス状態の監視を続けます。 

緊急 

トランスメタデバイスに障害があり、あと 1 つ障害が発生したらデータを失います。トランスメタデバイスに RAID5 メタデバイスまたはミラーが含まれる場合にだけ、この状態が発生します。 

エラーの発生したミラーまたは RAID5 マスターデバイスを修復します。「ミラーと RAID5 メタデバイスにおけるスライスの交換と有効化の概要」を参照してください。

重大な障害 (ログなし) 

トランスメタデバイスにロギングデバイスが接続されていません。 

ロギングデバイスを接続します。ロギングデバイスが接続されるまでは、ファイルシステムのロギングを開始できません。 

重大な障害 (ログハードエラー) 

デバイスの使用中に、デバイスエラーまたはファイルシステムでパニックが発生しました。デバイスが閉じられるかマウント解除されるまで、読み書きのたびに入出力エラーが返されます。最初に開いたとき、このデバイスはエラー状態に移行します。 

トランスメタデバイスを修復します。「ファイルシステムのパニックを起こしたトランスメタデバイスの回復方法 (コマンド行)」、または 「ハードエラーを起こしたトランスメタデバイスの回復方法 (コマンド行)」を参照してください。

重大な障害 (エラー) 

デバイスは読み書き可能です。ファイルシステムも読み取り専用でマウントできるのに、実際に読み書きしてみるとそのつど入出力エラーが返されています。この状態からは、たとえファイルシステムでパニックが発生したり、デバイスエラーが発生しても、ハードエラー状態には戻りません。 

トランスメタデバイスを修復します。「ファイルシステムのパニックを起こしたトランスメタデバイスの回復方法 (コマンド行)」、または 「ハードエラーを起こしたトランスメタデバイスの回復方法 (コマンド行)」を参照してください。fsck(1M) または newfs(1M) が正常に終了すると、デバイスは正常状態に移行します。デバイスがハードエラーまたはエラーの状態にある場合、fsck はファイルシステムをブート時に自動的にチェックおよび修復します。newfs は、デバイスにどんなデータがあっても、これを破壊します。

ホットスペア集合とホットスペアの状態 (DiskSuite ツール)

ホットスペア集合オブジェクトの状態フィールドに含まれるキーワードと実行可能な操作を表 3-7 に示します。

表 3-7 ホットスペア集合の状態キーワード

キーワード 

意味 

操作 

正常 

ホットスペアは動作中であり、データを受け付ける用意ができているが、現在のところ、ホットスペアでは読み書きが行われていません。 

ありません。 

使用中 

現在、ホットスペアに読み書きが行われています。 

ホットスペアの使用状況を診断してから、ホットスペアが使用されているメタデバイス内のスライスを修復します。 

注意 

ホットスペアまたはホットスペア集合に障害がありますが、すぐにデータが消失する危険はありません。ホットスペア集合にホットスペアが存在しない場合、またはすべてのホットスペアが使用中であるか壊れているホットスペアがある場合にも、この状態が表示されます。 

ホットスペアの使用状況や故障原因を診断します。必要ならば、ホットスペア集合にホットスペアを追加できます。 

メタデバイスとホットスペア集合の状態のチェック方法 (コマンド行)

前提条件 (「DiskSuite オブジェクトを保守するための前提条件」) を満たしていることを確認します。metastat(1M) コマンドを使用して、メタデバイスやホットスペア集合の状態を表示します。詳細については、metastat(1M) のマニュアルページを参照してください。

コマンド行の出力と実行可能な操作の説明は、次のリストを使用して、適切なページを参照してください。


注 -

DiskSuite の一般的な状態キーワードの説明については、表 3-2 を参照してください。


ストライプと連結の状態 (コマンド行)

連結またはストライプがサブミラーとして使用されない限り、DiskSuite は連結またはストライプの状態変化を通知しません。詳細については、「ストライプと連結の状態 (DiskSuite ツール)」を参照してください。

ミラーとサブミラーの状態 (コマンド行)

ミラー上で metastat(1M) を実行すると、各サブミラーの状態、パス番号、読み取りオプション、書き込みオプション、ミラー内の総ブロック数サイズが表示されます。ミラーのパス番号、読み取りオプション、書き込みオプションを変更するには、「ミラーのオプションの変更方法 (コマンド行)」を参照してください。

metastat から出力されたミラーの例を次に示します。


# metastat
d0: Mirror
    Submirror 0: d1
      State: Okay        
    Submirror 1: d2
      State: Okay        
    Pass: 1
    Read option: roundrobin (default)
    Write option: parallel (default)
    Size: 5600 blocks
 
d1: Submirror of d0
    State: Okay        
    Size: 5600 blocks
    Stripe 0:
        Device              Start Block  Dbase State        Hot Spare
        c0t2d0s7                   0     No    Okay        
 
...

ミラー内の各サブミラーに対して、metastat は、その状態、呼び出し (Invoke) 行 (エラーがある場合)、割り当てられたホットスペア集合 (もしあれば)、ブロック単位のサイズ、サブミラー内の各スライスについての情報を表示します。

サブミラーの状態を表 3-8 に示します。

表 3-8 サブミラーの状態 (コマンド行)

状態 

意味 

Okay 

サブミラーにはエラーがなく、正しく機能しています。 

Resyncing 

サブミラーは、アクティブに再同期されています。エラーが発生して訂正されました。サブミラーがちょうどオンラインに復帰したか、または新しいサブミラーが追加されました。 

Needs Maintenance 

サブミラー内のスライスに、入出力エラーまたはオープンエラーが発生しました。サブミラー内のこのスライスに対するすべての読み書きは中止されました。 

さらに、サブミラー内のストライプごとに、metastat は、ストライプ内のスライスのデバイス名 (Device)、スライスが始まる開始ブロック (Start Block)、スライスに状態データベースの複製が含まれるかどうか (Dbase)、スライスの状態 (Status)、障害の発生したスライスのホットスペアに使用されるスライスを示すホットスペア (Hot Spare) を表示します。

ミラーのエラーを解決する場合、おそらくこのスライス状態は最も重要な情報となります。サブミラー状態は、「Okay (正常)」や「Needs Maintenance (要保守)」などの一般的な状態情報を提供するだけです。サブミラーが「Needs Maintenance」状態を通知した場合、スライス状態を参照してください。スライスが「Maintenance (保守状態)」または「Last Erred (最後にエラーが発生した状態)」にある場合、別の障害回復アクションを実行することになります。「Maintenance」のスライスだけが存在する場合、これらのスライスは任意の順序で修復できます。「Maintenance」のスライスと「Last Erred」スライスが存在する場合、最初に「Maintenance」のスライスを修復してから、「Last Erred」スライスを修復しなければなりません。詳細は、「ミラーと RAID5 メタデバイスにおけるスライスの交換と有効化の概要」を参照してください。

サブミラーのスライス状態と実行可能な操作を表 3-9 に示します。

表 3-9 サブミラーのスライス状態 (コマンド行)

状態 

意味 

操作 

Okay 

スライスにはエラーがなく、正常に機能しています。 

ありません。 

Resyncing 

サブミラーの再同期処理が活発に行われています。エラーの発見、訂正処理を行なっていたり、サブミラーがオンライン状態に復帰した直後、または新たにサブミラーが追加された状態です。 

必要ならば、再同期が終了するまで、サブミラーの状態を監視します。 

Maintenance 

スライスに入出力エラーまたはオープンエラーが発生しました。このスライスとの読み書きはすべて中止されました。 

エラーの発生したスライスを有効にするか交換します。「サブミラー内のスライスを有効にする方法 (コマンド行)」、または 「サブミラー内のスライスを交換する方法 (コマンド行)」を参照してください。

注 : metastat(1M) コマンドでは、 metareplace(1M) コマンドで実行すべき適切な操作と一緒に、invoke 障害回復メッセージを表示します。 metareplace -e コマンドも使用できます。

Last Erred 

スライスに入出力エラーまたはオープンエラーが発生しました。しかし、他のスライスにも障害が発生しているため、データは他の場所に複写されません。スライス上では、まだ入出力が実行中です。この入出力がエラーになると、ミラー入出力は異常終了します。 

最初に、「保守状態」のスライスを有効にするか交換します。「サブミラー内のスライスを有効にする方法 (コマンド行)」、または 「サブミラー内のスライスを交換する方法 (コマンド行)」を参照してください。通常、このエラーによって一部のデータが失われるため、修復してからミラーの妥当性をチェックします。ファイルシステムの場合、fsck(1M) コマンドを使用して「メタデータ」の妥当性をチェックしてから、ユーザーデータをチェックします。アプリケーションやデータベースには、メタデータの妥当性をチェックするための独自の方法が必要です。

RAID5 メタデバイスの状態 (コマンド行)

RAID5 メタデバイス上で metastat(1M) コマンドを実行すると、メタデバイスの状態が表示されます。さらに、RAID5 メタデバイス内のスライスごとに、 metastat は、ストライプ内のスライスのデバイス名 (Device)、スライスが始まる開始ブロック (Start Block)、スライスに状態データベースの複製が含まれるかどうか (Dbase)、スライスの状態 (Status)、障害の発生したスライスのホットスペアに使用されるスライスを示すホットスペア (Hot Spare) を表示します。

metastat から出力された RAID5 メタデバイスの例を次に示します。


# metastat
d10: RAID
    State: Okay        
    Interlace: 32 blocks
    Size: 10080 blocks
Original device:
    Size: 10496 blocks
        Device              Start Block  Dbase State        Hot Spare
        c0t0d0s1                 330     No    Okay        
        c1t2d0s1                 330     No    Okay        
        c2t3d0s1                 330     No    Okay 

RAID5 メタデバイスの状態を表 3-10 に示します。

表 3-10 RAID5 の状態 (コマンド行)

状態 

意味 

Initializing 

スライスは、すべてのディスクブロックをゼロで初期化操作中にあります。この操作は、データとパリティを飛び越しストライピングする RAID5 メタデバイスの特性上、必要なものです。 

 

状態が「Okay (正常)」に変化したら、初期化プロセスが完了しており、デバイスを開くことができます。それまで、アプリケーションはエラーメッセージを受け取ります。 

Okay 

デバイスの使用準備が整っており、今のところエラーはありません。 

Maintenance 

読み書き操作中に発生した入出力エラーかオープンエラーが発生したため、1 つのスライスがエラーとマークされました。 

RAID5 メタデバイスのエラーに対処する場合、おそらくこのスライス状態は最も重要な情報となります。RAID5 状態は、「Okay (正常)」や「Needs Maintenance (要保守)」などの一般的な状態情報を提供するだけです。RAID5 が「Needs Maintenance」状態を通知した場合、スライス状態を参照してください。スライスが「Maintenance (保守状態)」または「Last Erred (最後にエラーが発生した状態)」にある場合、別の障害回復操作を実行することになります。「Maintenance」のスライスが 1 つだけ存在する場合、そのスライスはデータを失うことなく修復できます。「Maintenance」のスライスと「Last Erred」のスライスが存在する場合、データはおそらく破壊されています。最初に「Maintenance」のスライスを修復してから、「Last Erred」のスライスを修復しなければなりません。詳細は、「ミラーと RAID5 メタデバイスにおけるスライスの交換と有効化の概要」を参照してください。

RAID5 メタデバイスのスライス状態と実行可能な操作を、表 3-11 に示します。

表 3-11 RAID5 のスライス状態 (コマンド行)

状態 

意味 

操作 

Initializing 

スライスは、すべてのディスクブロックをゼロで初期化操作中にあります。この操作は、データとパリティを飛び越しストライピングする RAID5 メタデバイスの特性上、必要なものです。 

通常は、ありません。このプロセス中に入出力エラーが発生した場合、デバイスは「Maintenance (保守状態)」となります。初期化に失敗した場合、メタデバイスは「初期化失敗状態」となり、スライスは「Maintenance」となります。この場合、メタデバイスを削除して再作成します。 

Okay 

デバイスの使用準備が整っており、今のところエラーはありません。 

ありません。必要ならば、スライスの追加や交換が行えます。 

Resyncing 

スライスの再同期処理が活発に行われています。エラーの発見、訂正処理を行なっていたり、スライスがオンライン状態に復帰した直後、または新たにスライスが追加された状態です。 

希望により、再同期が完了するまで、RAID5 メタデバイスの状態を監視します。 

Maintenance 

読み書き操作中に発生した入出力エラーやオープンエラーが発生したため、1 つのスライスにエラーがマークされました。 

エラーの発生したスライスを有効にするか交換します。「RAID5 メタデバイス内のスライスを有効にする方法 (コマンド行)」、または 「RAID5 スライスの交換方法 (コマンド行)」を参照してください。

注 : metastat(1M) コマンドでは、 metareplace(1M) コマンドで実行すべき適切な操作と一緒に、invoke 障害回復メッセージを表示します。

Last Erred 

複数のスライスにエラーが発生しました。エラーの発生したスライスの状態は、「Maintenance」か「Last Erred」です。この状態では、「Maintenance」にあるスライスには入出力が行われないが、「Last Erred」とマークされたスライスには入出力が試され、その結果入出力要求の状態は全体的にこの状態 (Last Erred) となります。 

エラーの発生したスライスを有効にするか交換します。「RAID5 メタデバイス内のスライスを有効にする方法 (コマンド行)」、または 「RAID5 スライスの交換方法 (コマンド行)」を参照してください。

注 : metastat(1M) コマンドを起動すると、metareplace(1M) コマンドに適切なオプション (-f フラグ) を付けて実行するように表示されます。つまり、複数のエラースライスから正確でないデータが生成された可能性があることを示します。

トランスメタデバイスの状態 (コマンド行)

トランスメタデバイス上で metastat(1M) コマンドを実行すると、メタデバイスの状態が表示されます。

metastat から出力されたトランスメタデバイスの例を次に示します。


# metastat
d20: Trans
    State: Okay        
    Size: 102816 blocks
    Master Device: c0t3d0s4
    Logging Device: c0t2d0s3
 
        Master Device       Start Block  Dbase
        c0t3d0s4                   0     No  
 
c0t2d0s3: Logging device for d0
    State: Okay        
    Size: 5350 blocks
 
        Logging Device      Start Block  Dbase
        c0t2d0s3                 250     No 

metastat コマンドは、マスターデバイスとロギングデバイスも表示します。デバイスごとに次の情報が表示されます。スライスまたはメタデバイスのデバイス名 (Device)、デバイスが始まる開始ブロック (Start Block)、デバイスに状態データベースの複製が含まれるかどうか (Dbase)、ロギングデバイス用の状態 (State)。

トランスメタデバイスの状態と実行可能な操作を表 3-12 に示します。

表 3-12 トランスメタデバイスの状態 (コマンド行)

状態 

意味 

操作 

Okay 

デバイスは正しく機能しています。マウントされているものの場合、ファイルシステムはロギングされているので、ブート時のチェックはありません。 

ありません。 

Attaching 

トランスが閉じられたりマウント解除されたとき、ロギングデバイスがトランスメタデバイスに接続されます。そのとき、デバイスは「Okay (正常)」状態に移行します。 

metattach(1M) のマニュアルページを参照してください。

Detached 

トランスメタデバイスにはロギングデバイスがありません。UFS ロギングの利点が無効になります。 

fsck(1M) は、デバイスをブート時に自動的にチェックします。 metadetach(1M) のマニュアルページを参照してください。

Detaching 

トランスが閉じられたりマウント解除されたとき、ロギングデバイスはトランスメタデバイスから切断されます。そのとき、デバイスは「Detached (切断)」状態に移行します。 

metadetach(1M) のマニュアルページを参照してください。

Hard Error 

デバイスの使用中に、デバイスエラーやファイルシステムのパニックが発生しました。デバイスが閉じられるかマウント解除されるまで、読み書きのたびに入出力エラーが返されます。最初に開いた時点で、デバイスは「Error (エラー)」状態に移行します。 

トランスメタデバイスを修復します。 「ファイルシステムのパニックを起こしたトランスメタデバイスの回復方法 (コマンド行)」、または 「ハードエラーを起こしたトランスメタデバイスの回復方法 (コマンド行)」を参照してください。

Error 

デバイスは読み書き可能です。ファイルシステムも読み取り専用でマウントできるのに、実際に読み書きしてみるとそのつど入出力エラーが返されています。この状態からは、たとえファイルシステムでパニックが発生したり、デバイスエラーが発生しても、ハードエラー状態には戻りません。 

トランスメタデバイスを修復します。 「ファイルシステムのパニックを起こしたトランスメタデバイスの回復方法 (コマンド行)」、または 「ハードエラーを起こしたトランスメタデバイスの回復方法 (コマンド行)」を参照してください。 fsck(1M) または newfs(1M) が正常に終了すると、デバイスは「Okay」状態に移行します。デバイスが「Hard Error」または「Error」の状態にある場合、fsck はファイルシステムをブート時に自動的にチェックおよび修復します。newfs は、デバイスにどんなデータがあっても、これを破壊します。

ホットスペア集合とホットスペアの状態 (コマンド行)

ホットスペア集合上で metastat(1M) コマンドを実行すると、ホットスペア集合とそのホットスペアの状態が表示されます。

metastat から出力されたホットスペア集合の例を次に示します。


# metastat hsp001
hsp001: 1 hot spare
        c1t3d0s2                Available       16800 blocks

ホットスペア集合の状態と実行可能な操作を表 3-13 に示します。

表 3-13 ホットスペア集合の状態 (コマンド行)

状態 

意味 

操作 

Available 

ホットスペアは動作中であり、データを受け付ける用意ができているが、現在のところ読み書きが行われていません。 

ありません。 

In-use 

現在、ホットスペアを使用して読み書きが行われています。 

ホットスペアの使用状況を診断してから、ホットスペアが使用されているメタデバイス内のスライスを修復します。 

Attention 

ホットスペアまたはホットスペア集合に障害がありますが、すぐにデータが消失する危険はありません。ホットスペア集合にホットスペアが存在しない場合、またはすべてのホットスペアが使用中であるか壊れているホットスペアがある場合にも、この状態になります。 

ホットスペアの使用状況や故障原因を診断します。必要ならば、ホットスペア集合にホットスペアを追加できます。 

ディスクセットの状態のチェック方法 (コマンド行)

前提条件 (「DiskSuite オブジェクトを保守するための前提条件」) を満たしていることを確認します。metaset(1M) コマンドを使用して、ディスクセットの状態を表示します。詳細については、metaset(1M) のマニュアルページを参照してください。


注 -

ディスクセットの所有権は、所有者側のホストにだけ表示されます。


例 - 指定されたディスクセットの状態をチェック


red# metaset -s relo-red
Set name = relo-red, Set number = 1
 
Host                Owner
  red                Yes
  blue
 
Drive               Dbase
  c1t2d0             Yes
  c1t3d0             Yes
  c2t2d0             Yes
  c2t3d0             Yes
  c2t4d0             Yes
  c2t5d0             Yes

-s オプションを付けた metaset(1M) コマンドに続けてディスクセットの名前 relo-red を指定すると、そのディスクセットの状態情報が表示されます。所有者側のホスト red から metaset コマンドを発行すると、red が実際にディスクセットの所有者であることが確認できます。metaset コマンドは、ディスクセット内のドライブも表示します。

例 - すべてのディスクセットの状態をチェック


red# metaset
Set name = relo-red, Set number = 1
 
Host                Owner
  red                Yes
  blue
 
Drive               Dbase
  c1t2d0             Yes
  c1t3d0             Yes
  c2t2d0             Yes
  c2t3d0             Yes
  c2t4d0             Yes
  c2t5d0             Yes
 
Set name = relo-blue, Set number = 2
 
Host                Owner
  red
  blue
 
Drive               Dbase
  c3t2d0             Yes
  c3t3d0             Yes
  c3t4d0             Yes
  c3t5d0             Yes
 
Set name = rimtic, Set number = 3
 
Host                Owner
  red
  blue
 
Drive               Dbase
  c4t2d0             Yes
  c4t3d0             Yes
  c4t4d0             Yes
  c4t5d0             Yes

metaset コマンドを単独実行すると、すべてのディスクセットの状態が表示されます。この例では、relo-redrelo-blue、および rimtic という名前の 3 つのディスクセットが構成されます。ホスト redrelo-red ディスクセットを所有するため、metasetred を所有者として表示します。ホスト blue は、残り 2 つのディスクセットである relo-bluerimtic を所有します。これが明らかになるのは、metaset がホスト blue から実行された場合だけです。