ナビゲーションリンクをスキップ | |
印刷ビューの終了 | |
![]() |
Solaris Volume Manager 管理ガイド Oracle Solaris 10 1/13 Information Library (日本語) |
1. Solaris Volume Manager の使用開始
4. Solaris Volume Manager for Sun Cluster (概要)
5. Solaris Volume Manager の構成と使用 (シナリオ)
8. RAID-0 (ストライプと連結) ボリューム (概要)
9. RAID-0 (ストライプおよび連結) ボリューム (タスク)
20. Solaris Volume Manager の保守 (タスク)
Solaris Volume Manager の保守 (タスクマップ)
Solaris Volume Manager ボリューム構成を表示する方法
構成ファイルから Solaris Volume Manager を初期化する方法
Solaris Volume Manager のデフォルト値の変更
21. Solaris Volume Manager のベストプラクティス
25. Solaris Volume Manager のトラブルシューティング (タスク)
A. 重要な Solaris Volume Manager ファイル
B. Solaris Volume Manager のクイックリファレンス
Solaris Volume Manager では、RAID-1 (ミラー) および RAID-5 ボリューム内のコンポーネントの置き換えや有効化を行うことができます。
Solaris Volume Manager の用語で、コンポーネントの置き換えとは、サブミラーまたは RAID-5 ボリューム内の選択されたコンポーネントをシステム上の使用可能なコンポーネントに置き換える方法を指します。このプロセスは、コンポーネントの物理的な交換とは対照的に、論理的な交換と考えることができます。詳細は、「コンポーネントを別の使用可能なコンポーネントに置き換える」を参照してください。
コンポーネントの有効化とは、コンポーネントを「アクティブにする」か、またはそれ自体に置き換える (つまり、コンポーネント名が同じ) ことを指します。詳細は、「コンポーネントの有効化」を参照してください。
注 - ディスクエラーから回復する場合は、/var/adm/messages をスキャンして、どのような種類のエラーが発生したかを確認します。エラーが一時的で、ディスク自体に問題がない場合は、障害が発生したコンポーネントを有効にしてみてください。また、format コマンドを使用してディスクをテストすることもできます。
次のいずれかの条件が存在する場合は、コンポーネントを有効にすることができます。
Solaris Volume Manager が物理ドライブにアクセスできない。この問題は、電力損失やドライブケーブルの緩みなどのために発生する可能性があります。この場合は、Solaris Volume Manager がそのコンポーネントを「保守」状態にします。そのドライブに確実にアクセスできるようにしてから (電力の回復やケーブルの再接続など)、ボリューム内のコンポーネントを有効にする必要があります。
物理ドライブで、ディスクに関連しない一時的な問題が発生していることが疑われる。「保守」状態にあるコンポーネントを単純に有効にするだけで修復できることがあります。コンポーネントを有効にしても問題が解決されない場合は、次のいずれかを行う必要があります。
ディスクドライブを物理的に交換し、そのコンポーネントを有効にします。
そのコンポーネントをシステム上の別の使用可能なコンポーネントに置き換えます。
ディスクを物理的に交換した場合は、そのディスクを交換されたディスクと同様にパーティション分割して、使用されている各コンポーネント上に十分な容量を確保してください。
注 - 交換されるディスク上にある状態データベースの複製とホットスペアを常に確認してください。エラー状態にある状態データベースの複製はすべて、ディスクを交換する前に削除するようにしてください。次に、コンポーネントを有効にしたあと、同じサイズを使用して状態データベースの複製を再作成します。ホットスペアも同じ方法で処理するようにしてください。
既存のコンポーネントを、システムで使用されていない使用可能な別のコンポーネントに置き換えるか、またはスワップする場合は、metareplace コマンドを使用します。
このコマンドは、次のいずれかの条件が存在する場合に使用できます。
ディスクドライブに問題が発生していて、交換用ドライブがない場合。ただし、システム上のほかの場所には使用可能なコンポーネントが存在する。
この方法は、交換が絶対的に必要だが、システムを停止したくない場合にも使用できます。
物理ディスクでソフトエラーが表示される場合。
Solaris Volume Manager がミラー/サブミラーまたは RAID-5 ボリュームを「正常」状態で表示している場合でも、物理ディスクでソフトエラーが報告されることがあります。問題のコンポーネントを別の使用可能なコンポーネントに置き換えると、予防保守を実行することができ、ハードエラーの発生が防止される可能性があります。
パフォーマンスチューニングを行いたい場合。
コンポーネントを評価できる 1 つの方法として、Solaris 管理コンソール 内の拡張ストレージツールから使用可能なパフォーマンスモニタリング機能の使用があります。たとえば、RAID-5 ボリューム内の特定のコンポーネントが、「正常」状態にあるにもかかわらず平均負荷率が高くなっていることを確認できる場合があります。ボリューム上の負荷を分散させるために、そのコンポーネントを使用頻度の低いディスクのコンポーネントに置き換えることができます。このタイプの置き換えは、そのボリュームへのサービスを中断することなくオンラインで実行できます。
RAID-1 または RAID-5 ボリューム内のコンポーネントでエラーが発生すると、Solaris Volume Manager はそのコンポーネントを「保守」状態にします。「保守」状態にあるコンポーネントへのそれ以上の読み取りまたは書き込みは実行されません。
場合によっては、コンポーネントが「最後にエラー」状態になることがあります。RAID-1 ボリュームの場合、これは通常 1 面ミラーで発生します。ボリュームでエラーが発生します。しかし、読み取り元となる冗長なコンポーネントが存在しません。RAID-5 ボリュームの場合、これは 1 つのコンポーネントが「保守」状態になり、別のコンポーネントで障害が発生したあとに起こります。障害が発生した 2 つ目のコンポーネントが「最後にエラー」状態になります。
RAID-1 ボリュームまたは RAID-5 ボリュームのどちらかに「最後にエラー」状態のコンポーネントがある場合は、その「最後にエラー」のマークが付いたコンポーネントへの入出力が引き続き試みられます。この入出力の試みが起こるのは、Solaris Volume Manager の側から見た場合に、「最後にエラー」状態のコンポーネントにデータの最後の適切なコピーが含まれているからです。「最後にエラー」状態にあるコンポーネントを含むボリュームは正常なデバイス (ディスク) のように動作し、アプリケーションに入出力エラーを返します。通常は、この時点で、一部のデータが失われています。
同じボリューム内のほかのコンポーネントに関する以降のエラーは、ボリュームのタイプに応じて異なった方法で処理されます。
RAID-1 ボリュームは、「保守」状態にある多数のコンポーネントを許容し、引き続き読み取ったり書き込んだりできる可能性があります。コンポーネントが「保守」状態にある場合、データは失われていません。コンポーネントを任意の順序で安全に置き換えるか、または有効にすることができます。コンポーネントが「最後にエラー」状態にある場合は、まず「保守」状態にあるコンポーネントを置き換えるまで、そのコンポーネントを置き換えることができません。「最後にエラー」状態にあるコンポーネントの置き換えまたは有効化は通常、一部のデータが失われていることを示します。修復したあと、必ずそのミラー上のデータを検証してください。
RAID-5 ボリュームは、「保守」状態にある 1 つのコンポーネントを許容できます。データを失うことなく、「保守」状態にある 1 つのコンポーネントを安全に置き換えることができます。別のコンポーネントでエラーが発生した場合は、そのコンポーネントが「最後にエラー」状態になります。この時点で、RAID-5 ボリュームは読み取り専用デバイスになります。RAID-5 ボリュームの状態が安定し、データ損失の可能性が低くなるように、何らかの種類のエラー回復を実行する必要があります。RAID-5 ボリュームが「最後にエラー」状態に達した場合は、データが失われている可能性があります。修復したあと、必ずその RAID-5 ボリューム上のデータを検証してください。
常に、まず「保守」状態にあるコンポーネントを置き換え、そのあとで「最後にエラー」状態にあるコンポーネントを置き換えてください。コンポーネントが置き換えられ、再同期されたら、metastat コマンドを使用してその状態を確認します。次に、データを検証します。
RAID-1 ボリュームまたは RAID-5 ボリューム内のコンポーネントを置き換える場合は、次のガイドラインに従ってください。
常に、まず「保守」状態にあるコンポーネントを置き換え、そのあとで「最後にエラー」状態にあるコンポーネントを置き換えてください。
コンポーネントが置き換えられ、再同期されたら、metastat コマンドを使用してボリュームの状態を確認します。次に、データを検証します。「最後にエラー」状態にあるコンポーネントの置き換えまたは有効化は通常、一部のデータが失われていることを示します。修復したあと、必ずそのボリューム上のデータを検証してください。UFS の場合は、fsck コマンドを実行して「メタデータ」(ファイルシステムの構造) を検証します。次に、実際のユーザーデータを確認します。(実際には、各ユーザーが自分のファイルを検査する必要があります。)データベースやその他のアプリケーションは、自身の内部データ構造を検証するための独自の方法を備えている必要があります。
コンポーネントを置き換える場合は、状態データベースの複製とホットスペアを常に確認してください。エラー状態にある状態データベースの複製はすべて、物理ディスクを交換する前に削除するようにしてください。状態データベースの複製は、そのコンポーネントを有効にする前に戻すようにしてください。ホットスペアにも同じ手順が適用されます。
RAID-5 ボリュームのコンポーネントの置き換え中に、データは 2 つの方法のどちらかで回復されます。データは、現在使用されているホットスペアから回復されるか、またはホットスペアが使用されていない場合は RAID-5 パリティーを使用して回復されます。
RAID-1 ボリュームのコンポーネントを置き換えると、Solaris Volume Manager は、ボリュームの残りの部分を使用して新しいコンポーネントの再同期を自動的に開始します。再同期が完了すると、置き換えられたコンポーネントは読み取り/書き込み可能になります。障害が発生したコンポーネントがホットスペアのデータで置き換えられると、そのホットスペアが「使用可能」状態になり、ほかのホットスペアの置き換えに使用できるようになります。
新しいコンポーネントには、古いコンポーネントを置き換えるだけの十分な大きさが必要です。
予防策として、「最後にエラー」のデバイスを置き換える前に、すべてのデータをバックアップしてください。