この章では、Sun StorEdgeTM MultiPack ディスクと Sun StorEdge D1000 ディスクの管理方法について説明します。この章に示す作業の一部は、使用されているボリューム管理ソフトウェア (Solstice DiskSuite、VxVM) によって異なります。ボリュームマネージャによって作業方法が異なる場合は、作業のタイトル名にボリュームマネージャ名が示されています。
Sun Cluster 構成内のディスクハードウェアを交換または修復する場合は、Sun StorEdge MultiPack ディスクと Sun StorEdge D1000 ディスクのサービスマニュアル、およびボリューム管理ソフトウェアのマニュアルを参照してください。
Sun StorEdge MultiPack または Sun StorEdge D1000 が停電すると、I/O オペレーションはボリューム管理ソフトウェアによって検出されるエラーを生成します。これらのエラーは、ディスクに対して I/O トランザクションが行われるまでは報告されません。
これらのイベントについては、構成の監視が必要です。構成の監視については、第 2 章「Sun Cluster の管理ツール」を参照してください。
次に、Solstice DiskSuite 構成でディスク格納装置に電力損失が発生した場合の回復手順の概略を示します。
エラーが発生した複製を特定する
エラーが発生した複製をサービスに戻す
エラーが発生したデバイスを特定する
エラーが発生したデバイスをサービスに戻す
ディスクの同期をとり直す
次に、Solstice DiskSuite 構成でディスク格納装置に電力損失が発生した場合の詳しい回復手順を示します。
電力が戻った後で、metadb(1M) コマンドを実行してエラーが発生した複製を特定します。
# metadb -s diskset |
複製を稼動状態に戻します。
停電後、影響を受けたディスク格納装置のシャーシ上のすべてのメタデバイス状態データベースの複製がエラー状態になります。メタデバイス状態データベースの複製は自動回復しないため、ディスク格納装置がサービスに戻った直後に回復させるのが最も安全です。回復が遅れると障害がさらに発生し、複製のほとんどがサービス不能になり、カーネルの障害を引き起こす場合があります。これは、Solstice DiskSuite 構成で使用できる複製が少なすぎる場合によく起きる現象です。
エラーが発生したこれらの複製は次のテイクオーバー (haswitch(1M) または reboot(1M)) で修復されますが、これらを削除して追加し直すことにより手動で稼動状態に戻すこともできます。
各スライスで削除した複製と同じ数の複製を追加してください。複製は、metadb(1M) コマンドを 1 回実行することでまとめて削除できます。1 つのスライスに複製のコピーを複数格納する必要がある場合は、-c フラグを指定した metadb(1M) を 1 度呼び出し、まとめて追加します。
metstat(1M) コマンドを実行して、エラーが発生したメタデバイスを特定します。
# metastat -s diskset |
metareplace(1M) コマンドを使用して、エラーが発生したメタデバイスを稼動状態に戻します。これにより、ディスクの同期がとり直されます。
# metareplace -s diskset -e mirror component |
-e オプションは、コンポーネント (スライス) を Available 状態に変え、同期を取り直します。
ホットスペアに置き換えられているコンポーネントは、metareplace(1M) コマンドを使用して最後に交換してください。ホットスペアを最初に交換すると、ホットスペアが使用できる状態になったとたんに、エラーが発生したほかのサブミラーが交換される可能性があります。
一度に同期を取り直すことができるのは、サブミラー (メタデバイス) の 1 つのコンポーネントだけです。サブミラーのすべてのコンポーネントが停電の影響を受けた場合は、各コンポーネントを個々に交換する必要があります。1.05G バイトディスクの同期をとり直すには約 10 分かかります。
停電で複数のディスクセットが影響を受けた場合は、各ディスクセットの影響を受けたサブミラーの同期を同時にとり直すことができます。各ホストに個別にログインし、metareplace(1M) コマンドを各ホストで実行してホストのディスクセットを回復させてください。
サブミラーの数とサブミラー内のコンポーネントの数によっては、再同期に相当な時間がかかる場合があります。たとえば、コンポーネントが 5 つしかない管理が容易なサブミラーは、50 分ほどで完了する場合がありますが、1.05G バイトのドライブが 30 個あるようなサブミラーの場合は、完了までに約 5 時間かかる可能性があります。
停電が起きると、ディスクドライブが切り離されると同時に、プレックスが切り離されて使用できなくなります。ミラー化されていると、ボリューム内のほかのプレックスはそのまま使用できるため、ボリュームはアクティブに保たれます。クラスタ内のノードを停止せずにディスクドライブを再接続してこの状況を回復させることができます。
次に、VxVM 構成でディスク格納装置を電力損失から回復させる手順の概略を示します。
vxprint と vxdisk コマンドを使用して、エラーが発生したプレックスを確認する
電力損失の原因となった障害を修復する
drvconfig と disks コマンドを実行して、/devices と /dev エントリを作成する
現在のディスク構成を走査する
一時的な障害が発生したディスクを再接続する
障害がほかにないことを確認する
(省略可能) 共有ディスクグループでは、停電したディスクごとに vxdg コマンドを実行する
ボリュームの回復を開始する
次に、VxVM 構成でディスク格納装置を電力損失から回復させる詳しい手順を示します。
vxprint コマンドを実行して、エラーが発生したプレックスを表示します。
必要に応じて、-g diskgroup オプションを使用してディスクグループを指定してください。
vxdisk コマンドを実行して、エラーが発生したディスクを確認します。
# vxdisk list DEVICE TYPE DISK GROUP STATUS .. - - c1t5d0 toi failed was:c1t5d0s2 ... |
障害が発生したすべてのディスクに電力が戻るように、障害の原因を修復します。
修復を行う前に、ディスクが起動していることを確認してください。
クラスタ内のすべてのノードで、次のコマンドを入力します。
場合によっては、ノード別にドライブを確認し直す必要があります。
# drvconfig # disks |
クラスタ内のすべてのノードで、次のコマンドを入力します。
VxVM によって、現在のディスク構成の走査が再度行われます。
# vxdctl enable # vxdisk -a online |
クラスタ内のすべてのノードで、次のコマンドを入力します。
VxVM クラスタ機能 (Oracle Parallel Server で使用される) の場合は、このコマンドを最初にマスターノードで実行してから、他の各ノードで実行してください。
このコマンドにより、一時的な障害が発生していたディスクが接続し直されます。
# vxreattach -r |
vxdisk コマンドの出力を検証し、ほかにエラーがないかどうかを確認します。
# vxdisk list |
メディアを交換した場合は、切り離されたディスクごとにマスターノードから次のコマンドを入力します。
このコマンドにより、物理ディスクとそのディスクのボリュームマネージャのアクセス名が再結合されます。
# vxdg -g diskgroup -k adddisk medianame=accessname |
medianame と accessname の値が、vxdisk list コマンド出力の最後に表示されます。
次に例を示します。
# vxdg -g toi -k adddisk c1t5d0=c1t5d0s2 # vxdg -g toi -k adddisk c1t5d1=c1t5d1s2 # vxdg -g toi -k adddisk c1t5d2=c1t5d2s2 # vxdg -g toi -k adddisk c1t5d3=c1t5d3s2 # vxdg -g toi -k adddisk c1t5d4=c1t5d4s2 |
ディスクの再接続には、vxdiskadm コマンドまたは GUI も使用できます。
ノードからボリュームの回復を開始します。
# vxrecover -bv [-g diskgroup] |
共有ディスクグループがある場合は、vxrecover -svc を使用します。
(省略可能) vxprint -g コマンドを実行して、変更を表示します。
この節では、Sun StorEdge MultiPack と Sun StorEdge D1000 のコンポーネントを管理する方法について説明します。障害が発生したコンポーネントを確認するには、サーバーのサービスのマニュアルを参照してください。
ディスク格納装置からクラスタノードの 1 つに対する接続が失敗した場合は、通常、SCSI-2 ケーブルまたは SBus カードに欠陥があります。
どのようなイベントにおいても、障害が発生したノードは、障害が発見された時点でエラーを生成し始めます。ディスク格納装置に対してその後アクセスがあると、さらにエラーが生成されます。ノードは、ディスク格納装置が停電したかのように動作します。
この種の障害は、クラスタ内のほかのノードからの I/O 操作には影響を与えません。
障害を診断するには、Sun Cluster ノードのサービスマニュアルに示されたカードモジュールのテスト作業を行い、障害が発生したコンポーネントを確認してください。ハードウェアの障害追跡を行うには、ノードの 1 つとダウンしていると思われるディスク格納装置を解放してください。
コンポーネントの交換ができるように Sun Cluster システムの準備を行います。
切断の原因にもとづいて、次に示す作業の 1 つを行なって Sun Cluster ノードの準備を行います。
障害が発生したコンポーネントが SBus カードの場合、第 7 章「サーバーコンポーネントの管理」を参照して Sun Cluster ノードの電源が落とせるように準備します。
問題が SCSI-2 ケーブルの欠陥にある場合は、ボリューム管理ソフトウェアによってすでにその問題をが検出され、ケーブルが交換できるようにシステムが準備されています。
障害が発生したコンポーネントを交換します。
SCSI-2 ケーブルまたは SBus カードに障害が発生した場合は、Sun Cluster ノードのサービスマニュアルで詳しい交換方法を確認してください。
ボリューム管理ソフトウェアをエラーから回復させます。
「電力損失からの回復」に示された作業を行なってください。
Sun StorEdge MultiPack と Sun StorEdge D1000 は、任意の時点で Sun Cluster 構成に追加できます。
ディスク格納装置を追加するには、あらかじめ Sun Cluster 構成内のディスクグループ構成を確認する必要があります。ディスク格納装置がディスクグループ構成に与える影響を調べるには、『Sun Cluster 2.2 ソフトウェアのインストール』の第 2 章の説明と、このマニュアルの付録 A 「ボリュームマネージャの管理」の説明を参照してください。
クラスタノードの 1 つを停止します。
「クラスタとクラスタノードの停止」の作業を行なって、ノードを停止してください。
必要に応じ、ノードに別の SBus カードを取り付けます。
Sun Cluster ノードのハードウェアサービスマニュアルに示された作業方法に従って、SBus カードを取り付けてください。
SBus カードは、ノード内のほかのカードに続くように、SBus スロットの最初の空きスロットに差し込んでください。これにより、Solaris オペレーティング環境が再インストールされる場合に、コントローラの番号付けがそのまま保たれます。詳細は、「インスタンス名と番号付け」を参照してください。
SCSI-2 ケーブルを、ディスク格納装置に接続します。
Sun Cluster ノードのハードウェアサービスマニュアルに示された作業方法に従ってください。
SCSI イニシエータ ID を適宜設定します。
Sun Cluster ノードのハードウェアサービスマニュアルに示された作業方法に従ってください。
ノードの再構成リブートを行います。
ok boot -r |
haswitch(1M) コマンドを実行して、制御可能なすべての論理ホストの所有権をリブートしたノードに切り替えます。
phys-hahost1# haswitch phys-hahost2 hahost1 hahost2 |
このディスク格納装置に接続されているほかのノードで、手順 1 から 手順 5までを繰り返します。
必要に応じ、論理ホストの所有権を該当するデフォルトマスターにスイッチバックします。
次に例を示します。
phys-hahost1# haswitch phys-hahost2 hahost2 |
ディスク格納装置内のディスクを、選択されたディスクグループに追加します。
ボリュームマネージャのマニュアルに示された作業方法に従って、ディスクを選択されたディスクグループに追加してください。『Sun Cluster 2.2 ソフトウェアのインストール』の Solstice DiskSuite、VxVM についての説明も参照してください。
標準の Sun Cluster 管理の一環として、構成状態を監視することをお勧めします。監視方法の詳細は、第 2 章「Sun Cluster の管理ツール」を参照してください。監視処理で、多重ホストディスクの障害が発見される場合があります。この節では、この障害を解決する方法について説明します。
Sun Cluster は、いくつかのディスクタイプをサポートします。多重ホストディスク拡張装置のハードウェアサービスマニュアルで、ディスク格納装置の説明を参照してください。
対称構成では、ディスク格納装置が複数のディスクグループのディスクを搭載していることもあります。この場合、影響を受けるディスクグループをすべて単一のノードが所有する必要があります。
次に、Sun StorEdge MultiPack ディスクまたは Sun StorEdge D1000 ディスクを追加する手順の概略を示します。
新しいディスクのコントローラを確認し、ディスク格納装置内の空のスロットを見つける
新しいディスクを追加する
ディスクを Sun Cluster で使用するための管理作業を行う
/devices 特殊ファイル、/dev/dsk リンク、/dev/rdsk リンクを作成する
ディスクをディスクセットに加える
必要に応じて、ディスクのフォーマットとパーティション分割を行う
ボリューム管理関連の管理作業を行う
次に、Sun StorEdge MultiPack ディスクまたは Sun StorEdge D1000 ディスクを追加する詳しい手順を示します。
ディスクの追加先であるディスク格納装置のコントローラ番号を確認します。
mount(1M) または format(1M) コマンドを使用して、コントローラ番号を確認してください。
ディスクを追加する、ディスク格納装置の空のディスクスロットを見つけます。
空のスロットは、ディスク格納装置の前面にあるディスクドライブ LED または装置の左側のカバーを外して確認できます。スロットに対応するターゲットアドレス ID が、ドライブベイの中央部分に示されています。
これ以降の手順では、トレー 2 が例として使用されています。新しいディスク用に選択されるスロットは、トレー 2 のスロット 7 です。新しいディスクは、c2t3d1 として認識されます。
新しいディスクを追加します。
ディスク格納装置のサービスマニュアルに示された方法で、ディスクを追加するためのハードウェア上の作業を行なってください。
drvconfig(1M) と disks(1M) コマンドを実行し、すべての新しいディスクの /devices、/dev/dsk、/dev/rdsk に新しいエントリを作成します。
phys-hahost1# drvconfig phys-hahost1# disks |
論理ホストの所有権を、このディスクの接続先であるほかのクラスタノードに切り替えます。
phys-hahost1# haswitch phys-hahost2 hahost1 hahost2 |
このディスクの追加先であるディスクグループを現在所有しているノードで、drvconfig(1M) と disks(1M) コマンドを実行します。
phys-hahost2# drvconfig phys-hahost2# disks |
ボリューム管理ソフトウェアを使用して、ディスクグループにディスクを追加します。
Solstice DiskSuite のコマンド構文は次のとおりです。diskset には、障害が発生したディスクを含むディスクセットの名前を指定します。drive には、ディスクの DID 名を dN (Sun Cluster を新たにインストールする場合) または cNtYdZ (HA 1.3 からアップグレードする場合) の形式で指定します。
# metaset -s diskset -a drive |
VxVM では、コマンド行インタフェースまたはグラフィカルユーザーインタフェースを使用してディスクグループにディスクを追加できます。
Solstice DiskSuite を使用している場合は、metaset(1M) コマンドによりディスクが自動的に再分割される場合があります。詳細は、Solstice DiskSuite のマニュアルを参照してください。
(Solstice DiskSuite 構成のみ) metaset(1M) コマンドを使用してディスクセットにディスクを追加した後、scadmin(1M) コマンドを使用して指定したディスクに対してフェイルファストの予約と有効化を行います。
phys-hahost1# scadmin reserve drivename |
新しいディスクに対し、通常の管理作業を行います。
新しいドライブをサービスに加える場合に行う通常の管理手順を実行できます。これらの作業の詳細は、ボリューム管理ソフトウェアのマニュアルを参照してください。
必要に応じて、論理ホストをそのデフォルトマスターにスイッチバックします。
この節では、ボリュームマネージャによって次のような問題が報告された場合に、Sun Cluster サービスを中断することなく多重ホストディスクを交換する方法 (オンライン交換) について説明します。
保守状態 (Needs Maintenance のコンポーネント
ホットスペアの交換
断続的なディスクエラー
オフライン交換の方法については、ボリューム管理ソフトウェアのマニュアルを参照してください。
ディスクに 保守状態 (Needs Maintenance) のコンポーネントが存在する、ホットスペアがコンポーネントを交換した、あるいはディスクが断続的なエラーを生成していると判断した場合は、次の作業を行なってください。
次に、Solstice DiskSuite 環境で Sun StorEdge MultiPack ディスクまたは Sun StorEdge D1000 ディスクを交換する手順の概略を示します。
交換する必要のあるディスクを確認する
交換するディスクがどのディスク拡張装置に入っているか確認する
ディスクセットから障害のあるディスクを削除する
ディスクを停止し、ディスク格納装置を解放する
ディスクドライブを交換する
scdidadm -R コマンドを実行する
ディスクセットに新しいディスクを追加する
ディスクに対してフェイルファストの予約と有効化を行う
新しいディスクをパーティションに分割する
metastat(1M) コマンドを実行して、障害が修復されたことを確認する
次に、Solstice DiskSuite 環境で Sun StorEdge MultiPack ディスクまたは Sun StorEdge D1000 ディスクを交換する詳しい手順を示します。
この作業は、障害のあるディスクが含まれているディスクセットを制御するホストで行なってください。必要に応じて、haswitch(1M) コマンドを使用してディスクセットをスイッチオーバーしてください。
交換するディスクを確認します。
metastat(1M) コマンドと /var/adm/messages の出力を使用してください。
デバイスが保守状態にあるか、コンポーネントの一部がホットスペアに置き換わっていることを metastat(1M) が報告する場合は、そのデバイスを見つけ、交換する必要があります。次に、metastat(1M) の出力例を示します。この例では、デバイス c3t3d4s0 が保守状態 (Needs Maintenance) です。
phys-hahost1# metastat -s hahost1 ... d50:Submirror of hahost1/d40 State: Needs Maintenance Stripe 0: Device Start Block Dbase State Hot Spare c3t3d4s0 0 No Okay c3t5d4s0 ... |
/var/adm/messages を検査し、どのような問題が検出されたかを確認してください。
... Jun 1 16:15:26 host1 unix: WARNING: /io- unit@f,e1200000/sbi@0.0/SUNW,pln@a0000000,741022/ssd@3,4(ssd49): Jun 1 16:15:26 host1 unix: Error for command `write(I))' Err Jun 1 16:15:27 host1 unix: or Level: Fatal Jun 1 16:15:27 host1 unix: Requested Block 144004, Error Block: 715559 Jun 1 16:15:27 host1 unix: Sense Key: Media Error Jun 1 16:15:27 host1 unix: Vendor `CONNER': Jun 1 16:15:27 host1 unix: ASC=0x10(ID CRC or ECC error),ASCQ=0x0,FRU=0x15 ... |
障害のあるディスクを特定します。
mount(1M) コマンドまたは format(1M) コマンドを実行して、コントローラ番号を確認してください。
障害のあるディスクに複製が含まれる場合は、スライスと複製の数を記録してから複製を削除します。
metadb(1M) コマンドを実行して、複製を削除します。
交換するディスク上のコンポーネントを含んでいるサブミラーを切り離します。
障害が発生したコンポーネントを含むサブミラーを切り離す場合、metadetach -f コマンドを使用してください。次のコマンド例は、メタミラー d40 から サブミラー d50 を切り離します。
phys-hahost1# metadetach -s hahost1 -f d40 d50 |
metaclear(1M) コマンドを実行して、手順 5 で切り離されたサブミラーを消去します。
phys-hahost1# metaclear -s hahost1 -f d50 |
障害のあるディスクにホットスペアが含まれている場合は、デバイスの名前とホットスペアプールが入ったデバイスの一覧を記録し、その後ホットスペアを削除します。
metahs(1M) コマンドを実行してホットスペアを削除してください。
この情報は、オブジェクトを削除する前に記録してください。これは、ディスクを交換した後で逆の作業を行えるようにするためです。
metaset(1M) コマンドを使用して、ディスクセットから障害が発生したディスクを削除します。
このコマンドの構文を次に示します。diskset には、障害が発生したディスクを含むディスクセットの名前を指定します。drive には、ディスクの DID 名を dN (Sun Cluster を新たにインストールする場合) または cNtYdZ (HA 1.3 からアップグレードする場合) の形式で指定します。
phys-hahost1# metaset -s diskset -d drive |
この処理は、構成のサイズとディスクの数に応じて 15 分以上かかります。
障害のあるディスクを交換します。
この手順の詳細は、ディスク格納装置のハードウェアサービスマニュアルを参照してください。
新しいディスクが起動していることを確認します。
ディスクは、自動的に起動します。
新しいデバイス ID を使用して、DID ドライバのデータベースを更新します。
HA 1.3 からアップグレードした場合は、インストールは DID ドライバを使用しません。この場合、この手順を省略してください。
-l フラグを指定して scdidadm(1M) を実行し、交換されるドライブの低レベルデバイス名の DID 名を確認してください。続いて、-R フラグを指定して scdidadm(1M) を実行し、DID ドライブデータベースを更新してください。DID 疑似ドライバの詳細は、『Sun Cluster 2.2 ソフトウェアのインストール』を参照してください。
phys-hahost1# scdidadm -o name -l /dev/rdsk/c3t3d4 6 phys-hahost1:/dev/rdsk/c3t3d4 /dev/did/rdsk/d6 phys-hahost1# scdidadm -R d6 |
metaset(1M) コマンドを使用して、ディスクセットに新しいディスクを追加し直します。
この手順により、障害が発生したディスクから削除された正確な数の複製が自動的に追加し直されます。コマンド構文は次のとおりです。diskset には、障害が発生したディスクを含むディスクセットの名前を指定します。drive には、ディスクの DID 名を dN (Sun Cluster を新たにインストールする場合) または cNtYdZ (HA 1.3 からアップグレードする場合) の形式で指定します。
phys-hahost1# metaset -s diskset -a drive |
この処理は、構成のサイズとディスクの数に応じて 15 分以上かかります。
scadmin(1M) コマンドを使用して、ディスクセットに追加したディスクに対してフェイルファストの予約と有効化を行います。
phys-hahost1# scadmin reserve c3t3d4 |
format(1M) または fmthard(1M) コマンドを実行して、新しいディスクの再分割を行います。
新しいディスクが、交換されたディスクとまったく同じになるように分割してください (第 1 章「Sun Cluster の管理の準備」でディスクのフォーマット情報を保存するように推奨しています)。
metainit(1M) コマンドを使用して、手順 6 で消去したディスクの初期化を再度行います。
phys-hahost1# metainit -s hahost1 d50 |
手順 5で切り離したサブミラーを接続します。
この手順を行うには、metattach(1M) コマンドを使用してください。詳細は、metattach(1M) のマニュアルページを参照してください。
phys-hahost1# metattach -s hahost1 d40 d50 |
手順 7で削除したホットスペアをすべて復元します。
metahs(1M) コマンドを実行して、ホットスペアを追加し直してください。詳細は、metahs(1M) のマニュアルページを参照してください。
phys-hahost1# metahs -s hahost1 -a hsp000 c3t2d5s0 |
交換によって問題が解決されたことを確認します。
phys-hahost1# metastat -s hahost1 |
次に、VxVM 環境で Sun StorEdge MultiPack ディスクまたは Sun StorEdge D1000 ディスクを交換する手順の概略を示します。
vxdiskadm コマンドを使用して、ディスク格納装置内の障害ディスクを削除する
障害ディスクを交換する
vxdiskadm コマンドを使用して、先に削除したディスクを置き換える
共有ディスクグループを使用していないシステムでは、マスターノードはディスクグループをインポートしたノードを意味します。
共有ディスクグループを使用している場合は、クラスタ内のすべてのノードで次のコマンドを入力し、マスターノードとスレーブノードを確認します。
# vxdctl -c mode |
以下の手順は、マスターノードから実行してください。
そのディスクに障害が発生し、NODEVICE 状態かどうかを確認します。
ディスクが NODEVICE 状態ではない場合は、手順 8に進んでください。
vxdiskadm ユーティリティを実行し、4 (交換を行うディスクを削除する) を入力します。
このオプションは、ディスク名を保持したまま物理ディスクを削除します。この後、交換するデバイスを尋ねられます。
ディスク名または list を入力します。
次に、ディスク c2t8d0 の削除例を示します。
Enter disk name [<disk>,list,q,?] list Disk group: rootdg DM NAME DEVICE TYPE PRIVLEN PUBLEN STATE ... Disk group: demo DM NAME DEVICE TYPE PRIVLEN PUBLEN STATE dm c1t2d0 c2t2d0s2 sliced 1519 4152640 - dm c1t3d0 c2t3d0s2 sliced 1519 4152640 - dm c1t4d0 c2t4d0s2 sliced 1519 4152640 - dm c1t5d0 c2t5d0s2 sliced 1519 4152640 - dm c1t8d0 c2t8d0s2 sliced 1519 4152640 - dm c1t9d0 c2t9d0s2 sliced 1519 4152640 - dm c2t2d0 c1t2d0s2 sliced 1519 4152640 - dm c2t3d0 c1t3d0s2 sliced 1519 4152640 - dm c2t4d0 c1t4d0s2 sliced 1519 4152640 - dm c2t5d0 c1t5d0s2 sliced 1519 4152640 - dm c2t8d0 c1t8d0s2 sliced 1519 4152640 - dm c2t9d0 c1t9d0s2 sliced 1519 4152640 - Enter disk name [<disk>,list,q,?] c2t8d0 The requested operation is to remove disk c2t8d0 from disk group demo. The disk name will be kept, along with any volumes using the disk, allowing replacement of the disk. Select "Replace a failed or removed disk" from the main menu when you wish to replace the disk. |
y を入力するか、Return キーを押して継続します。
Continue with operation? [y,n,q,?] (default: y) y Removal of disk c2t8d0 completed successfully. |
q を入力してユーティリティを終了します。
Remove another disk? [y,n,q,?] (default: n) q |
vxdisk list と vxprint を入力して、変更を表示します。
ディスク c2t8d0 が削除されていることがわかります。
# vxdisk list . c2t3d0s2 sliced c1t3d0 demo online shared c2t4d0s2 sliced c1t4d0 demo online shared c2t5d0s2 sliced c1t5d0 demo online shared c2t8d0s2 sliced c1t8d0 demo online shared c2t9d0s2 sliced c1t9d0 demo online shared - - c2t8d0 demo removed # vxprint . dm c2t3d0 c1t3d0s2 - 4152640 - - - - dm c2t4d0 c1t4d0s2 - 4152640 - - - - dm c2t5d0 c1t5d0s2 - 4152640 - - - - dm c2t8d0 - - - - REMOVED - - dm c2t9d0 c1t9d0s2 - 4152640 - - - - pl demo05-02 - DISABLED 51200 - REMOVED - - sd c2t8d0-1 demo05-02 DISABLED 51200 0 REMOVED - - . . . |
どのコンポーネントの電源も落とさずに、物理ドライブを交換します。
詳細は、ディスク格納装置装置に付属のマニュアルを参照してください。
ドライブを交換する間、システムコンソールに次のようなメッセージが表示される場合があります。このメッセージは障害を示さない場合があるため、無視してください。以下に示す交換作業に進んでください。
Nov 3 17:44:00 updb10a unix: WARNING: /sbus@1f,0/SUNW,fas@0,8800000/sd@2,0 (sd17): Nov 3 17:44:00 updb10a unix: SCSI transport failed: reason "incomplete": ¥ retrying command Nov 3 17:44:03 updb10a unix: WARNING: /sbus@1f,0/SUNW,fas@0,8800000/sd@2,0 (sd17): Nov 3 17:44:03 updb10a unix: disk not responding to selection |
vxdiskadm ユーティリティを実行し、5 (障害が発生したディスクまたは削除されたディスクを交換する) を入力します。
ディスク名を入力します。
list を入力して、REMOVED 状態のディスクの一覧を表示できます。
ディスクに障害が発生していると、ディスクは NODEVICE 状態で示される場合があります。
Select a removed or failed disk [<disk>,list,q,?] list Disk group: rootdg DM NAME DEVICE TYPE PRIVLEN PUBLEN STATE ... Disk group: demo DM NAME DEVICE TYPE PRIVLEN PUBLEN STATE dm c2t8d0 - - - - REMOVED Select a removed or failed disk [<disk>,list,q,?] c2t8d0 |
vxdiskadm ユーティリティによって、新しいデバイスが検出され、削除したデバイスを新しいデバイスに置き換えるかどうかが尋ねられます。
システムに接続されたディスクの中に未使用のものがある場合は、vxdiskadm はそれらも選択肢として示します。
デバイス名を入力するか、ユーティリティによってそのデバイスがデフォルトとして示されている場合は Return キーを押します。
The following devices are available as replacements: c1t8d0s2 You can choose one of these disks to replace c2t8d0. Choose "none" to initialize another disk to replace c2t8d0. Choose a device, or select "none" [<device>,none,q,?] (default: c1t8d0s2) <Return> The requested operation is to use the initialized device c1t8d0s2 to replace the removed or failed disk c2t8d0 in disk group demo. |
y を入力するか、Return キーを押して、そのデバイス (この例では c1t8d0s2) を交換ディスクとすることを確定します。
Continue with operation? [y,n,q,?] (default: y) <Return> Replacement of disk c2t8d0 in group demo with disk device c1t8d0s2 completed successfully. |
n を入力するか、Return キーを押して、ユーティリティを終了します。
Replace another disk? [y,n,q,?] (default: n) <Return> |
vxdisk list と vxprint を入力して、変更を確認します。
この例では、ディスク c2t8d0 は REMOVED 状態ではなくなっています。
この節では、VxVM を使用する、Sun StorEdge MultiPack 格納装置または Sun StorEdge D1000 格納装置全体を交換する方法について説明します。
VxVM 構成で、障害が発生した Sun StorEdge MultiPack または Sun StorEdge D1000 全体を交換する手順の概略を示します。
vxdiskadm コマンドを使用して、障害のあるディスク格納装置内のディスクをすべて削除する
障害が発生したディスク格納装置を交換する
vxdiskadm コマンドを使用して、先に削除したディスクをすべて新しいディスク格納装置に置き換える
共有ディスクグループを使用していないシステムでは、マスターノードはディスクグループをインポートしたノードを意味します。
共有ディスクグループを使用している場合は、クラスタ内のすべてのノードで次のコマンドを入力し、マスターノードとスレーブノードを確認します。
# vxdctl -c mode |
以下の手順は、マスターノードから実行してください。
vxdiskadm ユーティリティを実行して 4 (交換を行うディスクを削除する) を入力することにより、障害が発生したディスク格納装置上のすべてのディスクを削除します。
このオプションでは、一度に 1 つのディスクしか削除できません。ディスクごとにこの作業を繰り返してください。
list コマンドを入力します。
次の例で、コントローラ c2 上のディスク格納装置を交換する必要があると想定します。この list 出力から、これらのディスクの VxVM 名は c2t2d0、c2t3d0、c2t4d0、c2t5d0、c2t8d0、c2t9d0 であることがわかります。
Remove a disk for replacement Menu: VolumeManager/Disk/RemoveForReplace Use this menu operation to remove a physical disk from a disk group, while retaining the disk name. This changes the state for the disk name to a "removed" disk. If there are any initialized disks that are not part of a disk group, you will be given the option of using one of these disks as a replacement. Enter disk name [<disk>,list,q,?] list Disk group: rootdg DM NAME DEVICE TYPE PRIVLEN PUBLEN STATE ... Disk group: demo DM NAME DEVICE TYPE PRIVLEN PUBLEN STATE dm c1t2d0 c2t2d0s2 sliced 1519 4152640 - dm c1t3d0 c2t3d0s2 sliced 1519 4152640 - dm c1t4d0 c2t4d0s2 sliced 1519 4152640 - dm c1t5d0 c2t5d0s2 sliced 1519 4152640 - dm c1t8d0 c2t8d0s2 sliced 1519 4152640 - dm c1t9d0 c2t9d0s2 sliced 1519 4152640 - dm c2t2d0 c1t2d0s2 sliced 1519 4152640 - dm c2t3d0 c1t3d0s2 sliced 1519 4152640 - dm c2t4d0 c1t4d0s2 sliced 1519 4152640 - dm c2t5d0 c1t5d0s2 sliced 1519 4152640 - dm c2t8d0 c1t8d0s2 sliced 1519 4152640 - dm c2t9d0 c1t9d0s2 sliced 1519 4152640 - |
ディスク名を入力します (この例では c2t2d0)。
Enter disk name [<disk>,list,q,?] c2t2d0 The following volumes will lose mirrors as a result of this operation: demo-1 No data on these volumes will be lost. The requested operation is to remove disk c2t2d0 from disk group demo. The disk name will be kept, along with any volumes using the disk, allowing replacement of the disk. Select "Replace a failed or removed disk" from the main menu when you wish to replace the disk. |
y を入力するか、Return キーを押して、そのディスクを交換することを確定します。
Continue with operation? [y,n,q,?] (default: y) <Return> Removal of disk c2t2d0 completed successfully. |
y を入力して継続します。
Remove another disk? [y,n,q,?] (default: n) y Remove a disk for replacement Menu: VolumeManager/Disk/RemoveForReplace Use this menu operation to remove a physical disk from a disk group, while retaining the disk name. This changes the state for the disk name to a "removed" disk. If there are any initialized disks that are not part of a disk group, you will be given the option of using one of these disks as a replacement. |
次のサンプルディスク名 c2t3d0 を入力します。
Enter disk name [<disk>,list,q,?] c2t3d0 The following volumes will lose mirrors as a result of this operation: demo-2 No data on these volumes will be lost. The following devices are available as replacements: c1t2d0 You can choose one of these disks now, to replace c2t3d0. Select "none" if you do not wish to select a replacement disk. |
必要に応じて、none を入力します。
この質問は、ユーティリティがシステム内に欠陥のないディスクを発見するたびに表示されます。欠陥のないディスクが存在しない場合、この質問は表示されません。
Choose a device, or select "none" [<device>,none,q,?] (default: c1t2d0) none |
y を入力するか、Return キーを押して、そのディスクを削除することを確定します。
The requested operation is to remove disk c2t3d0 from disk group demo. The disk name will be kept, along with any volumes using the disk, allowing replacement of the disk. Select "Replace a failed or removed disk" from the main menu when you wish to replace the disk. Continue with operation? [y,n,q,?] (default: y) <Return> Removal of disk c2t3d0 completed successfully. |
ディスク格納装置の電源を切り、交換します。
詳細は、ディスク格納装置のマニュアルを参照してください。
ディスク格納装置を交換する間、システムコンソールに次のようなメッセージが表示される場合があります。このメッセージは障害を示さない場合があるため、無視してください。以下に示す交換作業に進んでください。
Nov 3 17:44:00 updb10a unix: WARNING: /sbus@1f,0/SUNW,fas@0,8800000/sd@2,0 (sd17): Nov 3 17:44:00 updb10a unix: SCSI transport failed: reason "incomplete": ¥ retrying command Nov 3 17:44:03 updb10a unix: WARNING: /sbus@1f,0/SUNW,fas@0,8800000/sd@2,0 (sd17): Nov 3 17:44:03 updb10a unix: disk not responding to selection |
ディスク格納装置に電源を入れます。
詳細は、ディスク格納装置のサービスマニュアルを参照してください。
vxdiskadm ユーティリティを実行し、5 (障害が発生したディスクまたは削除されたディスクを交換する) を入力して、先に削除されているディスクをすべて接続します。
このオプションでは、一度に 1 つのディスクしか交換できません。ディスクごとにこの作業を繰り返してください。
list コマンドを入力して、各ディスク名が現在 REMOVED 状態であることを確認します。
Replace a failed or removed disk Menu: VolumeManager/Disk/ReplaceDisk Use this menu operation to specify a replacement disk for a disk that you removed with the "Remove a disk for replacement" menu operation, or that failed during use. You will be prompted for a disk name to replace and a disk device to use as a replacement. You can choose an uninitialized disk, in which case the disk will be initialized, or you can choose a disk that you have already initialized using the Add or initialize a disk menu operation. Select a removed or failed disk [<disk>,list,q,?] list Disk group: rootdg DM NAME DEVICE TYPE PRIVLEN PUBLEN STATE ... Disk group: demo DM NAME DEVICE TYPE PRIVLEN PUBLEN STATE dm c2t2d0 - - - - REMOVED dm c2t3d0 - - - - REMOVED dm c2t4d0 - - - - REMOVED dm c2t5d0 - - - - REMOVED dm c2t8d0 - - - - REMOVED dm c2t9d0 - - - - REMOVED |
ディスク名を入力します (この例では c2t2d0)。
Select a removed or failed disk [<disk>,list,q,?] c2t2d0 The following devices are available as replacements: c1t2d0s2 c1t3d0s2 c1t4d0s2 c1t5d0s2 c1t8d0s2 c1t9d0s2 |
vxdiskadm ユーティリティによって、新しいデバイスが検出され、削除したデバイスを新しいデバイスに置き換えるかどうかが尋ねられます。
デバイス名を入力するか、ユーティリティがそのデバイスをデフォルトとして示す場合は Return キーを押します。
You can choose one of these disks to replace c2t2d0. Choose "none" to initialize another disk to replace c2t2d0. Choose a device, or select "none" [<device>,none,q,?] (default: c1t2d0s2) <Return> |
y を入力するか、あるいは Return キーを押して、そのデバイス (この例では c1t2d0s2) を交換ディスクとすることを確定します。
The requested operation is to use the initialized device c1t2d0s2 to replace the removed or failed disk c2t2d0 in disk group demo. Continue with operation? [y,n,q,?] (default: y) <Return> Replacement of disk c2t2d0 in group demo with disk device c1t2d0s2 completed successfully. |
y を入力して継続します。
Replace another disk? [y,n,q,?] (default: n) y |