一般的な問題とその解決方法

以降のサブセクションでは、Oracle RAC のサポートに影響を与える可能性がある問題について説明します。各サブセクションで、問題の原因と問題の解決方法について説明します。

「Oracle RAC フレームワークリソースグループの障害」
「複数所有者ボリュームマネージャーのフレームワークリソースグループの障害」
「タイムアウトによって発生するノードパニック」
「SUNW.rac_framework または SUNW.vucmm_framework リソースの開始の失敗」
「SUNW.rac_framework の起動失敗ステータスメッセージ」
「SUNW.vucmm_framework の起動失敗ステータスメッセージ」
「START メソッドのタイムアウトから回復する方法」
「リソースの停止の失敗」

Oracle RAC フレームワークリソースグループの障害

このセクションでは、Oracle RAC フレームワークリソースグループに影響を与える可能性がある問題について説明します。

「Oracle RAC のサポートの初期化中のノードパニック」
「ucmmd デーモンの開始の失敗」
「ucmmd デーモンまたは関連コンポーネントの障害から回復する方法」

Oracle RAC のサポートの初期化中のノードパニック

Oracle RAC のサポートの初期化中に致命的な問題が発生した場合は、次のエラーメッセージと同様のエラーメッセージとともにノードでパニックが発生します。

panic[cpu0]/thread=40037e60: Failfast: Aborting because "ucmmd" died 30 seconds ago

説明: 再構成中に、UCMM が制御するコンポーネントが UCMM にエラーを返しました。

原因: この問題のもっとも一般的な原因は次のとおりです。

再構成の手順がタイムアウトしたために、Oracle RAC のサポートの初期化中にノードでパニックが発生する場合もあります。詳細は、「タイムアウトによって発生するノードパニック」を参照してください。

対処方法: この問題を修正する手順については、「ucmmd デーモンまたは関連コンポーネントの障害から回復する方法」を参照してください。

注 - ノードがグローバルクラスタのグローバルクラスタ投票ノードである場合は、ノードパニックによってマシン全体が停止します。ノードがゾーンクラスタノードである場合は、ノードパニックによってその特定のゾーンだけが停止し、ほかのゾーンは影響を受けません。

`ucmmd` デーモンの開始の失敗

UCMM デーモン ucmmd は、Oracle RAC のサポートの再構成を管理します。クラスタがブートまたはリブートされると、このデーモンは Oracle RAC のサポートのすべてのコンポーネントが検証されてから開始されます。ノード上のコンポーネントの検証に失敗すると、そのノード上では ucmmd デーモンが開始されません。

この問題のもっとも一般的な原因は次のとおりです。

Oracle RAC のサポートのコンポーネントの以前の再構成中にエラーが発生した。
Oracle RAC のサポートの以前の再構成に含まれる手順がタイムアウトしたため、タイムアウトが発生したノードでパニックが発生した。

この問題を修正する手順については、「ucmmd デーモンまたは関連コンポーネントの障害から回復する方法」を参照してください。

`ucmmd` デーモンまたは関連コンポーネントの障害から回復する方法

次のセクションで説明する問題を修正するには、このタスクを実行します。

「Oracle RAC のサポートの初期化中のノードパニック」
「ucmmd デーモンの開始の失敗」

問題の原因を判定するため、UCMM 再構成のログファイルとシステムメッセージファイルを調べます。
UCMM 再構成のログファイルの場所については、「診断情報のソース」を参照してください。
これらのファイルを調べるときは、最新のメッセージから始めて、問題の原因が特定されるまで過去にさかのぼります。
再構成エラーの原因を示している可能性があるエラーメッセージについては、『Oracle Solaris Cluster Error Messages Guide 』を参照してください。
コンポーネントが UCMM にエラーを返す原因となった問題を修正します。
例:
- 再構成の手順がタイムアウトした場合は、その手順のタイムアウトを指定する拡張プロパティーの値を増やします。
  詳細は、「タイムアウトによって発生するノードパニック」を参照してください。
問題の解決方法でリブートが必要な場合は、問題が発生したノードをリブートします。
特定の問題の解決方法でのみ、リブートが必要です。たとえば、共有メモリーの量を増やす場合は、リブートが必要です。しかし、手順のタイムアウトの値を増やす場合は、リブートは必要ありません。
ノードをリブートする方法については、『Oracle Solaris Cluster システム管理』の「クラスタ内の 1 つのノードの停止と起動」を参照してください。
問題が発生したノード上で、Oracle RAC フレームワークリソースグループをオフラインにしてからオンラインにします。
この手順により、構成変更を加えたリソースグループが更新されます。
1. スーパーユーザーになるか、RBAC の承認 solaris.cluster.admin を提供する役割になります。
2. Oracle RAC フレームワークリソースグループとそのリソースをオフラインにするコマンドを入力します。
```
# clresourcegroup offline -n node rac-fmwk-rg
```
  -n node
  
  問題が発生したノードのノード名とノード識別子 (ID) を指定します。
  
  rac-fmwk-rg
  
  オフラインにするリソースグループの名前を指定します。
3. Oracle RAC フレームワークリソースグループとそのリソースをオンラインおよび管理状態にするコマンドを入力します。
```
# clresourcegroup online -emM -n node rac-fmwk-rg
```

複数所有者ボリュームマネージャーのフレームワークリソースグループの障害

このセクションでは、複数所有者ボリュームマネージャーのフレームワークリソースグループに影響を与える可能性がある問題について説明します。

「複数所有者ボリュームマネージャーフレームワークの初期化中のノードパニック」
「vucmmd デーモンの開始の失敗」
「vucmmd デーモンまたは関連コンポーネントの障害から回復する方法」

複数所有者ボリュームマネージャーフレームワークの初期化中のノードパニック

複数所有者ボリュームマネージャーフレームワークの初期化中に致命的な問題が発生した場合は、次のようなエラーメッセージとともにノードでパニックが発生します。

注 - ノードがグローバルクラスタのグローバルクラスタ投票ノードである場合は、ノードパニックによってマシン全体が停止します。

`vucmmd` デーモンの開始の失敗

複数所有者ボリュームマネージャーフレームワークのデーモン vucmmd は、複数所有者ボリュームマネージャーフレームワークの再構成を管理します。クラスタがブートまたはリブートされると、このデーモンは複数所有者ボリュームマネージャーフレームワークのすべてのコンポーネントが検証されてから開始されます。ノード上のコンポーネントの検証に失敗すると、そのノード上では vucmmd デーモンが開始されません。

この問題のもっとも一般的な原因は次のとおりです。

複数所有者ボリュームマネージャーフレームワークのコンポーネントの以前の再構成中にエラーが発生した。
複数所有者ボリュームマネージャーフレームワークの以前の再構成に含まれる手順がタイムアウトしたため、タイムアウトが発生したノードでパニックが発生した。

この問題を修正する手順については、「vucmmd デーモンまたは関連コンポーネントの障害から回復する方法」を参照してください。

`vucmmd` デーモンまたは関連コンポーネントの障害から回復する方法

次のセクションで説明する問題を修正するには、このタスクを実行します。

「複数所有者ボリュームマネージャーフレームワークの初期化中のノードパニック」
「vucmmd デーモンの開始の失敗」

問題の原因を判定するため、複数所有者ボリュームマネージャーフレームワーク再構成のログファイルとシステムメッセージファイルを調べます。
複数所有者ボリュームマネージャーフレームワーク再構成のログファイルの場所については、「診断情報のソース」を参照してください。
これらのファイルを調べるときは、最新のメッセージから始めて、問題の原因が特定されるまで過去にさかのぼります。
再構成エラーの原因を示している可能性があるエラーメッセージについては、『Oracle Solaris Cluster Error Messages Guide 』を参照してください。
コンポーネントが複数所有者ボリュームマネージャーフレームワークにエラーを返す原因となった問題を修正します。
問題の解決方法でリブートが必要な場合は、問題が発生したノードをリブートします。
特定の問題の解決方法でのみ、リブートが必要です。たとえば、共有メモリーの量を増やす場合は、リブートが必要です。しかし、手順のタイムアウトの値を増やす場合は、リブートは必要ありません。
ノードをリブートする方法については、『Oracle Solaris Cluster システム管理』の「クラスタ内の 1 つのノードの停止と起動」を参照してください。
問題が発生したノード上で、複数所有者ボリュームマネージャーのフレームワークリソースグループをオフラインにしてからオンラインにします。
この手順により、構成変更を加えたリソースグループが更新されます。
1. スーパーユーザーになるか、RBAC の承認 solaris.cluster.admin を提供する役割になります。
2. 複数所有者ボリュームマネージャーのフレームワークリソースグループとそのリソースをオフラインにするコマンドを入力します。
```
# clresourcegroup offline -n node vucmm-fmwk-rg
```
  -n node
  
  問題が発生したノードのノード名とノード識別子 (ID) を指定します。
  
  vucmm-fmwk-rg
  
  オフラインにするリソースグループの名前を指定します。
3. 複数所有者ボリュームマネージャーのフレームワークリソースグループとそのリソースをオンラインおよび管理状態にするコマンドを入力します。
```
# clresourcegroup online -emM -n node vucmm-fmwk-rg
```

タイムアウトによって発生するノードパニック

Oracle RAC のサポート再構成の手順のいずれかがタイムアウトすると、タイムアウトが発生したノードでパニックが発生します。

再構成の手順がタイムアウトしないようにするには、クラスタ構成に依存するタイムアウトを調整します。詳細は、「タイムアウト設定のガイドライン」を参照してください。

再構成の手順がタイムアウトした場合は、Oracle Solaris Cluster の保守コマンドを使用して、その手順のタイムアウトを指定する拡張プロパティーの値を増やします。詳細は、付録 C Oracle RAC のサポート拡張プロパティーを参照してください。

拡張プロパティーの値を増やしたら、パニックが発生したノードで Oracle RAC フレームワークリソースグループをオンラインにします。

`SUNW.rac_framework` または `SUNW.vucmm_framework` リソースの開始の失敗

SUNW.rac_framework または SUNW.vucmm_framework リソースの起動に失敗した場合は、リソースのステータスを検証して、失敗の原因を判定します。詳細は、「Oracle RAC のサポートのステータスを検証する方法」を参照してください。

起動に失敗したリソースの状態は、「起動に失敗」として表示されます。関連付けられたステータスメッセージは、起動に失敗した原因を示します。

このセクションには、次の情報が含まれます。

`SUNW.rac_framework` の起動失敗ステータスメッセージ

次のステータスメッセージは、SUNW.rac_framework リソースの起動の失敗に関連付けられています。

Faulted - ucmmd is not running

説明: リソースが存在するノードで ucmmd デーモンが実行されていません。

対処方法: この問題の修正方法については、「ucmmd デーモンの開始の失敗」を参照してください。

Degraded - reconfiguration in progress

説明: UCMM は再構成中です。このメッセージが問題を示すのは、UCMM の再構成が完了しておらず、このリソースのステータスが持続的に低下したままになっている場合だけです。

原因: このメッセージが問題を示す場合、失敗の原因は Oracle RAC のサポートの 1 つ以上のコンポーネントの構成エラーです。

対処方法: この問題の解決方法は、メッセージが問題を示しているかどうかによって異なります。

メッセージが問題を示している場合は、「ucmmd デーモンまたは関連コンポーネントの障害から回復する方法」の説明に従って問題を修正します。
メッセージが問題を示していない場合は、何もする必要はありません。

Online

説明: SUNW.rac_framework リソースの START メソッドがタイムアウトするまでに、Oracle RAC の再構成が完了しませんでした。

対処方法: この問題を修正する手順については、「START メソッドのタイムアウトから回復する方法」を参照してください。

`SUNW.vucmm_framework` の起動失敗ステータスメッセージ

次のステータスメッセージは、SUNW.vucmm_framework リソースの起動の失敗に関連付けられています。

Faulted - vucmmd is not running

説明: リソースが存在するノードで vucmmd デーモンが実行されていません。

対処方法: この問題の修正方法については、「vucmmd デーモンの開始の失敗」を参照してください。

Degraded - reconfiguration in progress

説明: 複数所有者ボリュームマネージャーフレームワークは再構成中です。このメッセージが問題を示すのは、複数所有者ボリュームマネージャーフレームワークの再構成が完了しておらず、このリソースのステータスが持続的に低下したままになっている場合だけです。

原因: このメッセージが問題を示す場合、失敗の原因は複数所有者ボリュームマネージャーフレームワークの 1 つ以上のコンポーネントの構成エラーです。

対処方法: この問題の解決方法は、メッセージが問題を示しているかどうかによって異なります。

メッセージが問題を示している場合は、「vucmmd デーモンまたは関連コンポーネントの障害から回復する方法」の説明に従って問題を修正します。
メッセージが問題を示していない場合は、何もする必要はありません。

Online

説明: SUNW.vucmm_framework リソースの START メソッドがタイムアウトするまでに、Oracle RAC の再構成が完了しませんでした。

対処方法: この問題を修正する手順については、「START メソッドのタイムアウトから回復する方法」を参照してください。

`START` メソッドのタイムアウトから回復する方法

スーパーユーザーになるか、RBAC の承認 solaris.cluster.admin を提供する役割になります。
START メソッドがタイムアウトしたノードで、起動に失敗したフレームワークリソースグループをオフラインにします。
この操作を実行するには、リソースグループのプライマリノードを、グループがオンラインになっているほかのノードに切り替えます。
```
# clresourcegroup offline -n nodelist resource-group
```
-n nodelist

resource-group がオンラインになっているほかのクラスタノードのコンマ区切りリストを指定します。START メソッドがタイムアウトしたノードは、このリストから除外します。

resource-group

フレームワークリソースグループの名前を指定します。
複数所有者ボリュームマネージャーのフレームワークリソースグループと Oracle RAC フレームワークリソースグループの両方が構成に使用されている場合は、最初に複数所有者ボリュームマネージャーのフレームワークリソースグループをオフラインにします。複数所有者ボリュームマネージャーのフレームワークリソースグループがオフラインになったら、次に Oracle RAC フレームワークリソースグループをオフラインにします。
Oracle RAC フレームワークリソースグループが clsetup ユーティリティーを使用して作成された場合、リソースグループの名前は rac-framework-rg です。
Oracle RAC のサポートを実行できるすべてのクラスタノードで、オンラインにすることができなかったフレームワークリソースグループをオンラインにします。
```
# clresourcegroup online resource-group
```
resource-group

手順 2 でオフラインにしたリソースグループを MANAGED 状態にしてオンラインにするように指定します。

リソースの停止の失敗

リソースの停止に失敗した場合は、『Oracle Solaris Cluster Data Services Planning and Administration Guide』の「Clearing the STOP_FAILED Error Flag on Resources」の説明に従って問題を修正します。

ナビゲーションリンクをスキップ
印刷ビューの終了
	Oracle Solaris Cluster Data Service for Oracle Real Application Clusters ガイド Oracle Solaris Cluster 4.0 (日本語)