この章では、Oracle Hierarchical Storage Manager and StorageTek QFS Software およびファイルシステムの構成が、部分的または完全に消失したり破損したりした場合の回復プロセスについて概説します。サーバーホストで障害が発生した場合、Oracle HSM ソフトウェアとファイルシステム構成が消失することがあり、ファイルシステムのデータやメタデータが完全な状態で残っていても、構成情報が復元されるまでそれらにアクセスできません。この状況での成功は、残っているファイルやディレクトリから情報を取り出す作業者の能力と、障害に対してどれだけの準備をしてきたかに左右されます。
Oracle Hierarchical Storage Manager and StorageTek QFS インストールおよび構成ガイド に記載されている推奨手順に従った場合は、次の手順を使用すると、Oracle HSM ソフトウェアおよびファイルシステムの構成を回復できます。
サーバーホストで障害が発生したあとに構成を復元する場合は、必要に応じて、ハードウェアの問題を解決し、オペレーティングシステムおよびソフトウェアを再インストールします。
ルートファイルシステムの最新バックアップコピーが存在する場合は、ルートファイルシステムを復元し、ここで終了します。
それ以外の場合は、ファイルシステムサーバーホストに root
としてログインします。
root@solaris:~#
必要なファイルシステムをマウントします。バックアップ Oracle HSM 構成ファイルを格納するファイルシステム、およびデータファイルのディスクアーカイブコピーを保持するファイルシステムをマウントします。
この例では、独立したファイルシステム zfs1
上の sam_config
サブディレクトリに Oracle HSM サーバーの Solaris 構成ファイルのコピーを保持しています。そのため、マウントポイントを作成します。zfs1
をマウントします。zfs1
ファイルシステム内の最新のコピーから vfstab
ファイルを復元します。必要なマウントポイントを作成します。次に、ファイルシステムをマウントします。
root@solaris:~# cp /etc/vfstab /etc/vfstab.back root@solaris:~# mkdir /zfs1 root@solaris:~# mount -F zfs /net/remote.example.com/zfs1/ /zfs1 root@solaris:~# cp /zfs1/sam_config/20140127/etc/vfstab /etc/vfstab root@solaris:~# mkdir /diskvols root@solaris:~# mkdir /diskvols/DISKVOL1 root@solaris:~# mkdir /diskvols/DISKVOL2 ... root@solaris:~# mount /diskvols/DISKVOL1 root@solaris:~# mount /diskvols/DISKVOL2 ... root@solaris:~#
Oracle HSM 構成ファイルのバックアップコピーがある場合は、構成が消失する前の最新日付のコピーを探します。
この例では、独立したファイルシステム /zfs1
上の sam_config
サブディレクトリに Oracle HSM 構成ファイルのコピーを保持しています。そのため、最新ファイルは簡単に見つかります。
root@solaris:~# ls /zfs1/sam_config/20140127/etc/opt/SUNWsamfs/ archiver.cmd defaults.conf mcf recycler.cmd stager.cmd cfg_backups diskvols.conf mgmt_sched.conf releaser.cmd startup csn inquiry.conf notify.cmd scripts verifyd.cmd root@solaris:~# ls /zfs1/sam_config/20140127/etc/opt/SUNWsamfs/scripts archiver.sh log_rotate.sh nrecycler.sh recycler.sh save_core.sh sendtrap ssi.sh root@solaris:~# ls /zfs1/sam_config/explorer/ server1.20140430.1659MST.tar.gz server1.20140114.0905MST.tar.gz server1.20110714.1000MST.tar.gz
SAMreport が Oracle HSM 構成の消失前に生成された場合は、いちばん新しいものを探します。
QFS ファイルシステムが現在マウントされている場合は、アンマウントします。
消失した各構成ファイルについて、使用可能なバックアップファイルを復元先サーバー上の必要な場所にコピーします。
この例では、すべての Oracle HSM 構成ファイルおよびスクリプトをバックアップコピーから復元します (次のコマンドは 1 行で入力し、改行はバックスラッシュ文字でエスケープします)。
root@solaris:~# cp /zfs1/sam_config/20140127/etc/opt/SUNWsamfs/* \ /etc/opt/SUNWsamfs/ root@solaris:~# cp /zfs1/sam_config/20140127/etc/opt/SUNWsamfs/scripts/* \ /etc/opt/SUNWsamfs/scripts/ root@solaris:~# cp /zfs1/sam_config/20140127/etc/opt/SUNWsamfs/startup/* \ /etc/opt/SUNWsamfs/startup/ root@solaris:~# cp /zfs1/sam_config/20140127/etc/opt/SUNWsamfs/cfg_backups/* \ /etc/opt/SUNWsamfs/cfg_backups/ root@solaris:~# cp /zfs1/sam_config/20140127/etc/opt/SUNWsamfs/csn/* \ /etc/opt/SUNWsamfs/csn/
構成ファイルのバックアップコピーが存在しない場合は、使用可能な最新の SAMreport に含まれる情報を使用して再作成します。レポートから内容をコピーしてテキストエディタに貼り付け、レポートに記載されているファイルとパスに保存します。
SAMreport ファイルには、レポートが作成された時点での Oracle HSM 構成ファイルのフルテキストが含まれています。また、ファイルが保存されていたディレクトリも一覧表示されます。
この例では、ファイル server1
.20140127.SAMreport
で Oracle HSM マスター構成ファイル (mcf
) の情報を検索します。cat
コマンドの出力を grep
コマンドおよび正規表現パターン \/etc\/opt\/SUNWsamfs\/mcf
にパイプします (次のコマンドは 1 行で入力し、改行はバックスラッシュ文字でエスケープします)。
root@solaris:~# cat /zfs1/sam_config/explorer/server1.20140127.SAMreport | \ grep \/etc\/opt\/SUNWsamfs\/mcf ... ------------------ /etc/opt/SUNWsamfs/mcf ------------------- server1# /bin/ls -l /etc/opt/SUNWsamfs/mcf -rw-r--r-- 1 root root 1789 Feb 4 09:22 /etc/opt/SUNWsamfs/mcf # Equipment Equipment Equipment Family Device Additional # Identifier Ordinal Type Set State Parameters #------------------- --------- --------- --------- ------ ----------- hsmfs1 100 ms hsmfs1 on /dev/dsk/c1t3d0s3 101 md hsmfs1 on /dev/dsk/c1t4d0s5 102 md hsmfs1 on root@solaris:~#
grep
コマンドの出力をコピーして、その出力を vi エディタにペーストし、そのファイルを正しい名前と場所に保存します。
root@solaris:~# vi /etc/opt/SUNWsamfs/mcf # Equipment Equipment Equipment Family Device Additional # Identifier Ordinal Type Set State Parameters #------------------- --------- --------- --------- ------ ----------- hsmfs1 100 ms hsmfs1 on /dev/dsk/c1t3d0s3 101 md hsmfs1 on /dev/dsk/c1t4d0s5 102 md hsmfs1 on :wq root@solaris:~#
手順Oracle HSM 構成を保存するで保存したダンプファイルデータからライブラリカタログを復元します。各カタログに対して、コマンド build_cat
catalog-dump-file
catalog-file
を使用します。ここでは:
catalog-dump-file
は、dump_cat
コマンドで作成したファイルのパスと名前です。
catalog-file
は、復元されるカタログファイルのパスと名前です。
この例では、/zfs1/sam_config/20140513/catalogs/
library1cat.dump
ファイル内のデータを使用して、library1
のカタログを再構築します。
root@solaris:~# build_cat /zfs1/sam_config/20140513/catalogs/library1cat.dump \ /var/opt/SUNWsamfs/catalog/library1cat
ハードウェア障害のあと、システムを回復するには、第4章 ファイルシステムの回復に進みます。
誤って削除または編集した 1 つ以上の構成ファイルを置き換える場合で、ハードウェアまたはファイルシステムの変更が発生していない場合は、sam-fsd
コマンドを実行し、構成ファイルにエラーがないか確認します。
sam-fsd
は、Oracle HSM 構成ファイルを読み取る初期化コマンドです。エラーを検出すると停止します。
root@solaris:~# sam-fsd
sam-fsd
コマンドによって mcf
ファイルでエラーが見つかった場合は、ファイルを編集してエラーを修正し、前の手順の説明に従って再確認します。
次の例では、sam-fsd
によって、デバイスに関して何らかの問題があることが指摘されています。
root@solaris:~# sam-fsd Problem in mcf file /etc/opt/SUNWsamfs/mcf for filesystem hsmfs1 sam-fsd: Problem with file system devices. root@solaris:~#
sam-fsd
コマンドを実行してエラーが検出されない場合は、構成ファイルは正しい状態です。次の手順に進みます。
この例は、エラーのない出力の一部です。
root@solaris:~# sam-fsd Trace file controls: sam-amld /var/opt/SUNWsamfs/trace/sam-amld cust err fatal ipc misc proc date size 10M age 0 sam-archiverd /var/opt/SUNWsamfs/trace/sam-archiverd cust err fatal ipc misc proc date module size 10M age 0 sam-catserverd /var/opt/SUNWsamfs/trace/sam-catserverd cust err fatal ipc misc proc date module size 10M age 0 ... Would start sam-archiverd() Would start sam-stagealld() Would start sam-stagerd() Would start sam-amld() root@solaris:~#
mcf
ファイルを読み取り、適宜再構成を実行するよう、Oracle HSM ソフトウェアに指示します。コマンド samd
config
を使用します。
root@solaris:~# samd config Configuring SAM-FS root@solaris:~#
samd
config
コマンドで mcf
ファイルにエラーが報告された場合は、そのエラーを修正します。次に、前のステップを繰り返します。
影響を受けたファイルシステムを再マウントします。
ファイルシステムの操作をモニタリングします。
バックアップファイルまたは SAMreport がない場合は、使用可能な情報を使用して構成を再構築します。次に、新しい構成に進みます。手順については、{ent: SAMIC} を参照してください。