DiskSuite には、ミラーや RAID5 メタデバイスの内部でスライスの交換と有効化を行う機能があります。
DiskSuite の用語では、スライスの交換とは、サブミラーや RAID5 メタデバイス内の選択されたスライスを、システム上の有効なスライスで置き換えることです。スライスの物理的な交換とは対照的に、この方式を「メタ交換」と呼ぶことができます。スライスを有効化するとは、スライスをアクティブにしたり、スライスをそれ自身で置き換える (つまり、スライス名は同じ) ことです。
使用できる 2 つの方法とその使用タイミングを次に説明します。
ディスクエラーから回復する場合、/var/adm/messages を走査して、発生したエラーの種類を調べます。エラーが一時的な性質のものであり、ディスク自身には障害がない場合、エラーの発生したスライスの有効化を試みます。format(1M) コマンドを使用しても、ディスクをテストできます。
次のような場合、スライスの有効化が適切です。
ソフトエラーの可能性が高い場合は、現在エラーの発生しているスライスを有効にすることによって回復を試みます。
障害の発生したディスクドライブを新しいディスクドライブと物理的に交換し、元のドライブと同じようにパーティションに再分割し、エラーの発生したスライスをメタデバイス内部で有効にします。
次のような場合、スライスを有効化できます。
DiskSuite が物理ドライブにアクセスできないとき。
たとえば、この原因としては、電源断やドライブケーブルが抜けかかっている場合が挙げられます。この場合、DiskSuite はスライスを「保守状態」にします。ドライブにアクセス可能であることを確認 (電源の復旧、ケーブルの再接続など) してから、メタデバイス内のスライスを有効にします。
物理ドライブに、ディスクに関連しない一時的な障害があると思われるとき。
「保守状態」にあるスライスを、単に有効にするだけで修復できることもあります。これで障害を修復できない場合には、ディスクドライブを物理的に交換してスライスを有効にするか、そのスライスをシステム上の他の使用可能なスライスで「メタ交換」する必要があります。
ドライブを物理的に交換する場合は、古いドライブと同じようにパーティション分割します。なお、ドライブが物理的に交換されて古いドライブと同じようにパーティション分割されたら、エラーの発生したスライスを有効にするための作業は、前述の最初の条件の場合と同じです。
交換されるドライブ上のホットスペアと状態データベースの複製を必ずチェックしてください。エラーとして示される状態データベースの複製は、ディスクを交換する前に削除し、スライスを有効にする前に追加 (サイズが同じであることを確認) してください。ホットスペアも同様に処置してください。
既存のスライスを、システム上で使用可能な未使用の別のスライスと置き換えたり交換したりする場合、DiskSuite の「メタ交換」スライス機能を使用します。
次のような場合にこの方法を使用できます。
ディスクドライブに障害があり、交換用のドライブはないが、システム上の別の場所に使用可能なスライスがある場合 (交換が絶対的に必要であっても、システムをシャットダウンしたくない場合に、こうすることができます)。
ソフトエラーが発生している場合。
DiskSuite は、ミラー / サブミラーや RAID5 メタデバイスが「正常」状態にあるのに物理ディスクよりソフトエラーが通知されることがあります。問題のスライスを他の使用可能なスライスと交換すると、予防的保守を実行することになり、ハードエラーの発生を防げることがあります。
パフォーマンスチューニングを行いたい場合。
たとえば、DiskSuite ツールの統計情報表示機能を使用すれば、RAID5 メタデバイスが 「OKay」 状態であっても、ある特定のスライスに負荷が集中している状態を見ることができます。メタデバイス上の負荷を均一に分散させるため、そのスライスを使用率の少ないディスクのスライスと交換することができます。この種の交換は、メタデバイスへのサービスを中断することなく、オンラインで実行できます。
必要ならば、DiskSuite ツールを使用して、サブミラー全体を交換できます。そのためには、新しいサブミラー (連結方式オブジェクト) を作成し、交換するサブミラーの先頭にドラッグします。この作業については、「サブミラーの交換方法 (DiskSuite ツール)」を参照してください。
ミラーや RAID5 メタデバイス内のスライスにエラーが発生した場合、DiskSuite はそのスライスを「Maintenance (保守状態)」にします。「Maintenance」のスライスには、それ以降の読み書きは実行されません。その後、同じメタデバイス内で他のスライスにエラーが発生しても、その取り扱いはメタデバイスの種類に応じて異なります。ミラーは、多数のスライスが「Maintenance」にあっても動作可能であり、まだ読み書きを行うことができます。RAID5 メタデバイスは、定義により、「Maintenance」にあるスライスを 1 つだけ許容できます。ミラーまたは RAID5 メタデバイスに「Last Erred (最後にエラーが発生した状態)」のスライスがある場合、「Last Erred」とマークされたスライスにはまだ入出力が試みられます。その理由は、「Last Erred」のスライスには、DiskSuite から見て現時点で最新の正しいデータコピーに近いものが含まれているためです。「Last Erred」のスライスをもつメタデバイスは、正常なデバイス (ディスク) のように振る舞い、アプリケーションに入出力エラーを返します。通常、この時点で一部のデータは消失していることがあります。
必ず「Maintenance」のスライスを最初に交換してから、「Last Erred」のスライスを交換します。スライスが交換されて再同期されたら、metastat(1M) コマンドを使用してその状態を確認し、データの妥当性をチェックして、その内容が正しいことを確認します。
ミラー : スライスが「Maintenance」にある場合、データは失われていません。スライスは任意の順序で交換したり有効にすることができます。スライスが「Last Erred」にある場合、まず「Maintenance」にある他のすべてのミラー化スライスを交換してから、このスライスを交換できます。通常、「Last Erred」にあるスライスを交換したり有効にするということは、一部のデータが消失した状態であることを意味します。ミラーを修復してから、ミラー上のデータの妥当性をチェックしてください。
RAID5 メタデバイス : RAID5 メタデバイスは、単一のスライス障害に耐性を持ちます。「Maintenance」にあるスライスは、データを失うことなく、安全に交換できます。他のスライスにエラーが発生した場合、そのスライスは「Last Erred」となります。この時点で、RAID5 メタデバイスは読み取り専用デバイスとなります。何らかのエラー回復処置を実行して、RAID5 メタデバイスの状態を非エラー状態とし、データ損失の可能性を低下させる必要があります。RAID5 メタデバイスが「Last Erred」になった場合、データが失われた可能性が高いと言えます。RAID5 メタデバイスを修復したら、そこにあるデータの妥当性をチェックしてください。