ヘッダーをスキップ
Oracle® Fusion Middlewareディザスタ・リカバリ・ガイド
11g リリース1(11.1.1)
B61394-04
  目次へ移動
目次
索引へ移動
索引

前
 
次
 

7 Oracle Site Guardのトラブルシューティング

表7-1では、障害時リカバリ・トポロジにおいてOracle Site Guardをデプロイおよび管理するときに一般的に遭遇する可能性がある状況、およびそうした状況に対処するための手順について説明します。

表7-1 トラブルシューティング

シナリオ 説明およびソリューション

事前チェック操作

事前チェック操作が失敗した場合、次のエラーが表示されます。

Nmo setuid status NMO not setuid-root (Unix-only)

Oracle Management Agentのインストール後、『Oracle Enterprise Manager Cloud Control基本インストレーション・ガイド』「インストール後の作業」の項の説明に従って、root.shスクリプトを実行してください。

Oracle Management Agentが停止している場合、リモート・ホストでコマンドを実行しようとすると、事前チェック操作がハングします。

操作に関連するすべてのホストが有効であり、構成されているすべてのスクリプトが、構成された場所のリモート・ホストで利用可能になっていることを確認してください。何らかの理由でOracle Management Agentにアクセスできない場合、Enterprise Manager Cloud Controlコンソールからログ・ファイルを確認してください。どのホストが停止しているかわかっている場合は、それらのホストの事前チェック操作を省略することができます。

Oracle WebLogic Server


ノード・マネージャは、次のエラーが原因で失敗する場合があります。

<Sep 13, 2011 8:45:37 PM PDT> <Error> <NodeManager> <BEA-300033> <Could not execute command "getVersion" on the node manager. Reason: "Access to domain 'base_domain' for user 'weblogic' denied".>

この問題は、ノード・マネージャ資格証明を変更した後、正しいノード・マネージャ・ユーザーおよびパスワード・トークンが各管理対象サーバーに指定されているかを確認するためのnmEnrollを実行していない場合に発生する可能性があります。

次の構文を使用して、nmEnrollを実行します。

nmEnroll([domainDir], [nmHome])

例:

nmEnroll('C:/oracle/user_projects/domains/prod_domain',
'C:/oracle/wlserver_10.3/common/nodemanager')

注意: 変更を有効にするには、ノード・マネージャを再起動する必要があります。

Enterprise Manager Cloud ControlでのOracle WebLogic Server管理サーバー接続の失敗が原因で、管理対象サーバーが起動できません。

Oracle Site Guardで管理対象サーバーを起動するには、管理サーバーおよびノード・マネージャが必要です。管理対象サーバーを正常に起動、停止できるように、管理サーバーが起動して、実行されているか確認してください。

操作計画

システムの一部であるOracle DatabaseまたはOracle Fusion Middlewareファームのようなターゲットは、操作計画ワークフローで検出できません。

この問題は、操作計画を作成した後でシステムにターゲットを追加すると発生する場合があります。操作計画の作成中、Oracle Site Guardには、システムの一部であるこれらのターゲットのみが含まれます。新しいターゲットを追加した場合は、操作計画を再作成する必要があります。

Oracle WebLogic Serverドメインの一部であるOracle WebLogic Server管理対象サーバー・ターゲットは、操作計画ワークフローの作成時に、Oracle Site Guardによって更新されたり、認識されたりしません。

Enterprise Manager Cloud Controlで自動検出を実行する前に、管理対象サーバーが起動して、実行されていることを確認してください。

システムの一部であるOPMN管理対象システム・コンポーネントは、操作計画ワークフローでは検出できません。

Oracle Site Guardは、Enterprise Manager Cloud Controlで表現されたOPMN管理対象システム・コンポーネントのみを検出します。たとえば、Oracle HTTP ServerおよびOracle Web CacheのようなOPMN管理対象システム・コンポーネントは、Enterprise Manager Cloud Controlで表現されます。これらのコンポーネントは、Oracle Fusion Middlewareファームの一部として検出されます。

システムの一部であるOracle RACデータベースeは、操作計画ワークフローでは検出できません。

Oracle RACデータベースは、Enterprise Manager Cloud ControlのRACデータベース・ターゲットの下にグループ化され、表現されます。RACデータベース・インスタンスが検出されると、RACデータベース・ターゲットが作成され、RACデプロイメントのすべてのデータベース・インスタンスは、RACデータベース・ターゲットの下にグループ化されます。この問題は、各RACインスタンス・ターゲットが、RACデータベース・ターゲットではなく、システムに追加された時に発生する場合があります。Oracle Site Guardは、個々のRACインスタンスを特定できません。

スイッチオーバーまたはフェイルオーバー操作

スイッチオーバーまたはフェイルオーバー操作の後、管理サーバーは、起動に失敗する場合があります。管理サーバーの出力ログ・ファイルには、次のようなエラーが報告されます。

<Jan 19, 2012 3:43:05 AM PST> <Warning> <EmbeddedLDAP> <BEA-171520> <Could not obtain an exclusive lock for directory: ORACLE_BASE/admin/soadomain/aserver/soadomain/servers/AdminServer/data/ldap/ldapfiles. Waiting for 10 seconds and then retrying in case existing WebLogic Server is still shutting down.>

このエラーは、ロックを正常にクリーンアップできなかったことが原因で、管理サーバー・ログ・ファイルに表示されます。このエラーを修正するには、EmbeddedLDAP.lokファイル(ORACLE_BASE/admin/<domain_name>/aserver/<domain_name>/servers/AdminServer/data/ldap/ldapfiles/に格納)を削除します。

スイッチオーバーまたはフェイルオーバー操作の後、管理サーバーは、起動に失敗する場合があります。管理サーバーの出力ログ・ファイルには、次のようなエラーが報告されます。

<Sep 16, 2011 2:04:06 PM PDT> <Error> <Store> <BEA-280061> <The persistent store "_WLS_AdminServer" could not be deployed: weblogic.store.PersistentStoreException:

[Store:280105]The persistent file store "_WLS_AdminServer" cannot open file _WLS_ADMINSERVER000000.DAT.>

このエラーは、ネットワーク・ファイル・システム(NFS)ストレージからのロックが原因で表示されます。ストレージ・ベンダーのNFSユーティリティを使用して、NFSロックを消去する必要があります。.DATファイルを一時的な場所にコピーし、そのコピーを元に戻してロックを消去します。

スイッチオーバーまたはフェイルオーバー操作の実行中、新しいプライマリ・システムの一部のホストは、利用できないか、停止している場合があります。Oracle Site Guardは、これらのホストではいずれの操作も実行できません。

これらのホストで実行中のサービスが必須ではなく、サイトが引き続き機能しており、他のノードで実行中のサービスに対してアクティブである場合は、操作計画を更新することで、停止しているホストに関連する手順を無効化することができます。Oracle Site Guardワークフローは、無効化されたすべての手順を省略してワークフローを実行します。

Oracle RACデータベース・インスタンスが停止している場合、スイッチオーバーまたはフェイルオーバー操作は失敗します。

操作計画の作成中に、Oracle Site Guardは、スイッチオーバーまたはフェイルオーバー操作を実行するOracle RACデータベース・インスタンスを決定します。RACに複数のインスタンスがデプロイされていて、一部のインスタンスが停止している可能性があります。スイッチオーバーまたはフェイルオーバー操作を実行する前に、インスタンスが起動して、実行されていることを確認する必要があります。RACインスタンスを特定するには、get_operation_plan_detailsコマンドを実行します。

データベース操作

事前チェック操作またはスイッチオーバー/フェイルオーバー操作が失敗した場合、次のエラーが表示されます。

Database Status:
DGM-17016: failed to retrieve status for database "racs"
ORA-16713: the Data Guard broker command timed out

このエラーは、ターゲット・データベース・インスタンスで、Oracle Data Guard Broker Data Guardモニター・プロセス(DMON)が停止していることが原因で発生する場合があります。データベース・インスタンスを再起動し、DMONプロセスが起動して、実行されていることを確認する必要があります。DMONプロセス・エラーのデータベース・ログ・ファイルを表示することもできます。CommunicationTimeoutパラメータを使用して、環境に適したタイムアウト値を選択することができます。詳細は、『Oracle Data Guard Broker』の「CommunicationTimeout」の項を参照してください。