この章では、Oracle Fail Safe Managerに搭載されたトラブルシューティング・ツールに関する一般情報を記載します。この章では、次の項目について説明します。
Oracle Fail Safeには一元化されたメッセージ機能が備わっています。ある操作を実行した結果、エラーが発生すると、システムはエラーに対応するメッセージを検索し、そのメッセージを表示します。これらのメッセージの詳細は、『Oracle Fail Safeエラー・メッセージ』を参照してください。
Oracle Fail Safeには、ノード、グループおよびリソース状況の有効性を検証して、クラスタのコンポーネントおよび環境の有効性を検査する便利なツール・ファミリがあります。不一致や問題が検出されると、検証操作により適切な処置がとられ、実際に発生した問題や潜在的な問題をすべて修正します。
図6-1に、「トラブルシューティング」メニューの検証コマンドを示します。
表6-1に、検証コマンドとその詳細の参照先を示します。
表6-1 トラブルシューティングのための検証コマンド
ツール | 説明 | 参照 |
---|---|---|
Oracle Fail Safeインストール、Oracle製品インストール(Oracleホームおよび製品バージョン番号などを含む)、クラスタ・ネットワーク構成およびクラスタ・リソースDLL登録を検証します。 |
|
|
グループ・リソースおよびその依存性が正しく構成されているかを検証します。 |
|
|
スタンドアロン・データベース・インスタンスの有効性を検査し、別のノードに残っている旧構成情報を削除します。 |
|
検証コマンドを使用して、いつでも、クラスタ、グループまたはスタンドアロン・データベースの有効性を検査できます。検証中に問題が検出された場合、Oracle Fail Safeによって、問題を修正するようにプロンプトが出されるか、または問題を詳しく説明したエラー・メッセージが返されます。
いずれかの検証コマンドを実行したときにエラーが返された場合は、エラーを修正し、検証コマンドを再実行します。検証操作がエラーなしで実行されるまで、このプロセスを繰り返します。
「クラスタの検証」
操作により、クラスタのインストールおよびネットワーク構成の有効性が検査されます。クラスタの検証はいつでも実行できます。Oracle Fail Safe Managerのメニュー・バーで、「トラブルシューティング」→「クラスタの検証」を選択します。
Oracle Fail Safeソフトウェアのインストールまたはアップグレード後、初めてクラスタに接続する際に、「クラスタの検証」
操作を実行するように求められます。「クラスタの検証」
はいつでも実行できますが、クラスタ構成を変更したときは必ず実行する必要があります。「クラスタの検証」
操作により、次のことが検証されます。
OracleソフトウェアがインストールされているOracleホームの名前が、すべてのクラスタ・ノードに共通であること
たとえば、あるクラスタ・ノードのOracle Fail SafeソフトウェアのOracleホームの名前がOFS
である場合、Oracle Fail Safeがインストールされているクラスタ内のすべてのノードでOFSというOracleホーム名が使用されている必要があります。同じように、あるクラスタ・ノードのOracleデータベース・ソフトウェアのOracleホームの名前がOfsDb
である場合、Oracleデータベース・ソフトウェアがインストールされているクラスタ内のすべてのノードでOfsDbというOracleホーム名が使用されている必要があります。
Oracle Services for MSCSのリリースがすべてのノード上で同一であること
リソース・プロバイダ(コンポーネント)が各リソースの少なくとも2つの可能所有者であるノードでまったく同じに構成されていること
ホスト名とIPアドレスのマッピングがクラスタ内のすべてのノード間で矛盾なく解決していること
マッピングの不一致が存在する場合、「クラスタの検証」
コマンドはネットワーク・アダプタの順序が正しくないことを示すエラーを返します。 詳細は、付録Aを参照してください。
また、「クラスタの検証」
を行うと、OracleリソースDLLがMicrosoft Cluster Server(MSCS)に登録されます。
図6-2に、標準的な「クラスタの検証」
操作の出力を示します。
「クラスタの検証」
操作を実行しても正常に終了しない場合、次に示すいずれか1つまたは複数の問題があると考えられます。
ハードウェア、ネットワークまたはMSCSソフトウェアの構成の問題。
Oracleホームおよびバージョンの対称性の問題。
Oracle Fail Safeのインストール(たとえば、リソース・プロバイダの対称性)の問題。
操作が正常に終了していながらOracle Fail Safeで問題が発生している場合、Oracle Fail Safeの構成に問題があります。
「グループの検証」
操作によって、グループが正常に動作することを確認するために次のことが行われます。
グループ内のすべてのリソースをチェックし、グループの可能所有者であるすべてのノードで正しく構成されていることを確認します。
グループ内のリソース間の依存性を更新します。
プロンプトを表示した後で、構成の誤りのあるグループを修正します。
「グループの検証」
操作はいつでも実行できます。ただし、次の状況が発生した場合は、必ず実行してください。
グループを検証するには、Oracle Fail Safe Managerのツリー・ビューからグループを選び、Oracle Fail Safe Managerのメニュー・バーで「トラブルシューティング」→「グループの検証」を選択します。
または、FSCMD
コマンドのVERIFYGROUP
を使用して、「グループの検証」
操作を実行することも可能です(第5章を参照)。FSCMD
コマンドには、特定のクラスタ上にあり、Oracle Fail Safeによって構成されているグループをすべて検証するVERIFYALLGROUPS
コマンドもあります。VERIFYGROUP
コマンドとVERIFYALLGROUPS
コマンドは、スクリプト内でバッチ・ジョブとして実行できます。
Oracle Fail Safeのグループ検証の際、「グループの検証」
操作の進捗状況、グループ内の各リソースの状態を表示できます。
図6-3に、「グループの検証」
操作の出力を示します。
スタンドアロン・データベースは、「スタンドアロン・データベースの検証」
操作を使用していつでも検証できます。「スタンドアロン・データベースの検証」
コマンドを実行するには、Oracle Fail Safe Managerのツリー・ビューからデータベースを選び、Oracle Fail Safe Managerのメニュー・バーで「トラブルシューティング」→「スタンドアロン・データベースの検証」を選択します。
「スタンドアロン・データベースの検証」
操作では、有効性検査を実行し、スタンドアロン・データベースが常駐するノード上に正しく構成されているかどうかを確認して、もう一方のクラスタ・ノードに存在するデータベースへの参照を削除します。(データベースが、一度グループに追加された後で削除されたものである場合、別のクラスタ・ノードにデータベースへの参照が残っている可能性があります。)これによって、Oracle Fail Safeを使用した可用性の高いデータベースが実現されます。
グループにスタンドアロン・データベースを追加する前に、そのデータベースに対して「スタンドアロン・データベースの検証」
コマンドを実行してください。また、スタンドアロン・データベースへのアクセスに問題が生じた場合に、いつでもコマンドを使用できます。ただし、検証操作中、データベースはOracle Fail Safeにより停止および再起動されます。
たとえば、次のような場合に検証を実行します。
グループにデータベースを追加しようとしたときに障害が発生する場合。
Oracle Fail Safe Manager以外の管理者ツールを使用してデータベースを処理し、そのデータベースにアクセスできなくなってしまった場合。
Oracle Fail Safeソフトウェアを削除しないまま、(たとえば、ソフトウェアのアップグレード中に)クラスタ・ノードからMSCSソフトウェアを削除した場合。これについては、『Oracle Fail Safeインストレーション・ガイド』で詳しく説明されています。
図6-4に、「スタンドアロン・データベースの検証」ダイアログ・ボックスを示します。このダイアログ・ボックスで、ユーザーはスタンドアロン・データベースの有効なデータベース情報およびアカウント情報を入力します。
「スタンドアロン・データベースの検証」ダイアログ・ボックスを使用する際、次の項目を指定する必要があります。
「サービス名」フィールドに、スタンドアロン・データベースのサービス名
「インスタンス名」フィールドに、スタンドアロン・データベースのインスタンス名
「データベース名」フィールドに、スタンドアロン・データベースのデータベース名
「パラメータ・ファイル」フィールドに、スタンドアロン・データベースの初期化パラメータ・ファイルのパラメータ・ファイル・ディスク、パス名およびファイル名
「アカウント」領域に、Oracle Fail Safeでデータベースにアクセスするためのアカウント。
この情報をOracle Fail Safeでは次の場合に使用します。
Oracle Netによるクラスタワイドの問題の修正
スタンドアロン・データベースがクラスタ・ディスク上に存在するかどうかの確認
Oracle Fail Safeでデータベースにアクセス可能かどうかの確認
スタンドアロン・データベースがオープンされていると、「スタンドアロン・データベースの検証」
操作を実行してもデータベースは再起動されません。
スタンドアロン・データベースがオープンされていないか、データベースが停止されている場合、Oracle Fail Safeでは、データベース・インスタンスの停止および再起動を行ってよいかどうかをユーザーに確認します。次に、アクセスするためにデータベースがオープンされます。
図6-5に、クラスタワイド操作ウィンドウに表示される一般的な「スタンドアロン・データベースの検証」
操作の出力を示します。
検証で問題が検出された場合、「スタンドアロン・データベースの検証」
操作では、問題を修正する前にユーザーに確認します。たとえば、Oracle Netの問題が原因で、グループへのデータベースの追加に失敗した場合を考えます。「スタンドアロン・データベースの検証」
コマンドを実行してネットワーク問題を修正した後、データベースをグループに追加できます。
Oracle Fail Safeには、Oracle Fail Safe Managerのクラスタ・データをウィンドウ内に表示する「クラスタのダンプ」
コマンドがあります。このコマンドは、一定期間内にクラスタに対して行われた変更の記録を保持するために定期的に実行(同時に出力を保存)したり、Oracleサポート・サービスの要請に従って、クラスタ環境のスナップショットを作成するために実行する場合があります。
「クラスタのダンプ」
コマンドを実行した際に提示されるデータには、次のものがあります。
オプションで、「クラスタのダンプ」のデータをファイルに保存できます。「別名保存」をクリックしてください。
「クラスタのダンプ」
コマンドを実行するには、Oracle Fail Safe Managerのツリー・ビューからクラスタを選び、Oracle Fail Safe Managerのメニュー・バーで「トラブルシューティング」→「クラスタのダンプ」を選択します。
図6-6に、「クラスタのダンプ」
コマンドの出力のうち、NTCLU-150クラスタとそのリソースの一部に関する情報部分を示します。
Oracle Fail Safeには、fssvr
コマンド修飾子/GETSECURITY
があります。これは、コマンドを実行するシステムに関するセキュリティ情報を表示します。fssvr
コマンド修飾子/GETSECURITY
を各クラスタ・ノードで実行すると、FS-1075nのエラーの診断に役立ちます(nは、0から7までの値です)。
コマンドおよび関連する出力は、次のようになります。
fssvr /getsecurity Looking up user account information for OracleMSCSServices. The user account must be a domain user acount with local Administrator privileges. The user account must also have the 'Log on as batch job' privilege. User account specified for OracleMSCSServices is NEDCDOMAIN\cluadmin User account specified has local Administrator privileges User account has the 'Log on as batch job' privilege Looking up user account information for Cluster Service. The user account must be a domain user account with local Administrator privileges. The user account must also have the 'Log on as batch job' privilege. User account specified for Cluster Service is NEDCDOMAIN\cluadmin User account specified has local Administrator privileges User account has the 'Log on as batch job' privilege Checking to see if DCOM is enabled. DCOM must be enabled. DCOM is enabled.
この章では、Oracle Fail Safe Managerファミリのトラブルシューティング・ツールの使用方法について説明します。その他の情報は、次の方法で入手できます。
特定のコンポーネントのトラブルシューティングに関する情報は、可用性を高めるためのコンポーネントの構成方法について説明する、第7章から第9章の各章に記載しています。
ネットワーク構成の問題に関連するトラブルシューティングについては、付録Aで説明しています。
Oracle Fail Safeの階層はMicrosoft Cluster Serverソフトウェア上に形成されているため、クラスタ・サービス、インターコネクトおよびハードウェア構成に関する問題を解決するには、MSCSのマニュアルを参照する必要がある場合があります。
Oracle Fail Safeを起動できないときは、Windowsイベント ビューアを起動してアプリケーション・ログを表示します。通常、Oracle Services for MSCSにより、問題を識別するイベントのログが取られます。