一般的な問題と解決方法

次の副節では、Oracle RAC 用サポートに影響を与える可能性のある問題について説明します。それぞれの副節で、問題の原因とその問題の解決方法について説明します。

「RAC フレームワークリソースグループの障害」
「複数所有者ボリュームマネージャーのフレームワークリソースグループの障害」
「登録ファイルが見つからないため、SUNW.qfs の登録が失敗」
「タイムアウトによって起こるノードパニック」
「SUNW.rac_framework または SUNW.vucmm_framework リソースの起動の失敗」
「SUNW.rac_framework 起動失敗状態メッセージ」
「SUNW.vucmm_framework 起動失敗状態メッセージ」
「START メソッドのタイムアウトから回復する」
「リソースの停止の失敗」

RAC フレームワークリソースグループの障害

この節では、RAC フレームワークリソースグループに影響を与える可能性のある問題について説明します。

「Oracle RAC 用サポートの初期化中のノードパニック」
「ucmmd デーモンの開始の失敗」
「ucmmd デーモンまたは関連コンポーネントの障害から回復する」

Oracle RAC 用サポートの初期化中のノードパニック

Oracle RAC 用サポートの初期化中に致命的な問題が生じた場合、次のようなエラーメッセージとともにノードでパニックが発生します。

panic[cpu0]/thread=40037e60:Failfast:Aborting because "ucmmd" died 30 seconds ago

説明: 再構成中に、UCMM が制御するコンポーネントが UCMM にエラーを返しました。

原因: この問題のもっとも一般的な原因は次のとおりです。

SPARC:Oracle UDLM が含まれる ORCLudlm パッケージがインストールされていない。
SPARC:Oracle UDLM のバージョンが Oracle RAC 用サポートのバージョンと互換性がない。
SPARC:共有メモリーの量が Oracle UDLM を起動させるには不十分である。

再構成ステップがタイムアウトしたために、Oracle RAC 用サポートの初期化中にノードでパニックが発生する場合もあります。詳細は、「タイムアウトによって起こるノードパニック」を参照してください。

対処方法: 問題を修正する手順については、「ucmmd デーモンまたは関連コンポーネントの障害から回復する」を参照してください。

注 - ノードがグローバルクラスタの投票ノードであるときは、ノードパニックによってマシン全体が停止します。ノードがゾーンクラスタノードであるときは、ノードパニックによって特定のゾーンのみが停止し、他のゾーンは影響を受けません。

`ucmmd` デーモンの開始の失敗

UCMM デーモン、ucmmd は、Oracle RAC 用サポートの再構成を管理します。クラスタが起動または再起動すると、このデーモンは Oracle RAC 用サポートのすべてのコンポーネントが検証されてから開始されます。ノード上のコンポーネントの検証に失敗すると、ucmmd デーモンはそのノード上で開始できません。

この問題のもっとも一般的な原因は次のとおりです。

SPARC:Oracle UDLM が含まれる ORCLudlm パッケージがインストールされていない。
コンポーネント Oracle RAC 用サポートの以前の再構成中に、エラーが発生した。
Oracle RAC 用サポートの以前の再構成のステップがタイムアウトし、タイムアウトが生じたノードでパニックが発生した。

問題を修正する手順については、「ucmmd デーモンまたは関連コンポーネントの障害から回復する」を参照してください。

`ucmmd` デーモンまたは関連コンポーネントの障害から回復する

次の節で説明した問題を修正するには、この作業を実行します。

「Oracle RAC 用サポートの初期化中のノードパニック」
「ucmmd デーモンの開始の失敗」

問題の原因を特定するには、UCMM 再構成のログファイルとシステムメッセージファイルを調べます。
UCMM 再構成のログファイルの場所については、「診断情報のソース」を参照してください。
これらのファイルを調べるときは、最新のメッセージから始め、問題の原因を特定するまで遡ります。
再構成エラーの原因を示している可能性のあるエラーメッセージについては、『Oracle Solaris Cluster Error Messages Guide 』を参照してください。
コンポーネントが UCMM にエラーを返す原因となった問題を修正します。
たとえば、次のように使用します。
- SPARC:使用している Oracle リリースで Oracle UDLM が必要で、Oracle UDLM が含まれる ORCLudlm パッケージがインストールされていない場合は、そのパッケージをインストールします。
  注 - Oracle UDLM は、実際に使用されるときにのみ必要です。
  1. Oracle UDLM ソフトウェアのインストールと構成の前の手順をすべて完了していることを確認します。
    完了する必要のある手順は表 1-1 に一覧表示されています。
  2. Oracle UDLM ソフトウェアが正しくインストールおよび構成されていることを確認します。
    詳細は、「SPARC: Oracle UDLM のインストール」を参照してください。
- SPARC:Oracle UDLM のバージョンが Oracle RAC 用サポートのバージョンと互換性がない場合は、互換性のあるバージョンのパッケージをインストールします。
  詳細は、「SPARC: Oracle UDLM のインストール」を参照してください。
- SPARC:共有メモリーの量が Oracle UDLM を起動させるには不十分である場合は、共有メモリーの量を増やします。
  詳細は、「グローバルクラスタで Oracle RAC ソフトウェアの共有メモリーを構成する」を参照してください。
- 再構成ステップがタイムアウトした場合は、ステップのタイムアウトを指定する拡張プロパティーの値を増やします。
  詳細は、「タイムアウトによって起こるノードパニック」を参照してください。
問題に対する解決方法で再起動が必要な場合は、問題が発生したノードを再起動します。
特定の問題に対する解決方法でのみ、再起動が必要です。たとえば、共有メモリーの量を増やすには再起動が必要です。一方、ステップのタイムアウトの値を増やすには、再起動は必要ありません。
ノードを再起動する方法については、『Oracle Solaris Cluster システム管理』の「クラスタ内の 1 つのノードの停止と起動」を参照してください。
問題が発生したノードで、RAC フレームワークリソースグループをオフラインにしてからオンラインにします。
このステップにより、構成変更を加えたリソースグループが更新されます。
1. スーパーユーザーになるか、RBAC の承認 solaris.cluster.admin を提供する役割になります。
2. RAC フレームワークリソースグループとそのリソースをオフラインにするコマンドを入力します。
```
# clresourcegroup offline -n node rac-fmwk-rg
```
  -n node
  
  問題が発生したノードのノード名とノード識別子 (ID) を指定します。
  
  rac-fmwk-rg
  
  オフラインにするリソースグループの名前を指定します。
3. RAC フレームワークリソースグループとそのリソースをオンラインおよび管理状態にするコマンドを入力します。
```
# clresourcegroup online -emM -n node rac-fmwk-rg
```

複数所有者ボリュームマネージャーのフレームワークリソースグループの障害

この節では、複数所有者ボリュームマネージャーのフレームワークリソースグループに影響を与える可能性のある問題について説明します。

「複数所有者ボリュームマネージャーフレームワークの初期化中のノードパニック」
「vucmmd デーモンの開始の失敗」
「vucmmd デーモンまたは関連コンポーネントの障害から回復する」

複数所有者ボリュームマネージャーフレームワークの初期化中のノードパニック

複数所有者ボリュームマネージャーのフレームワークの初期化中に致命的な問題が生じた場合、次のようなエラーメッセージとともにノードでパニックが発生します。

注 - ノードがグローバルクラスタの投票ノードであるときは、ノードパニックによってマシン全体が停止します。

panic[cpu0]/thread=40037e60:Failfast:Aborting because "vucmmd" died 30 seconds ago

説明: 再構成中に、複数所有者ボリュームマネージャーのフレームワークが制御するコンポーネントが複数所有者ボリュームマネージャーのフレームワークにエラーを返しました。

原因: この問題のもっとも一般的な原因は、Veritas Volume Manager (VxVM) のライセンスが見つからないか期限が切れていることです。

再構成ステップがタイムアウトしたために、複数所有者ボリュームマネージャーのフレームワークの初期化中にノードでパニックが発生する場合もあります。詳細は、「タイムアウトによって起こるノードパニック」を参照してください。

対処方法: 問題を修正する手順については、「vucmmd デーモンまたは関連コンポーネントの障害から回復する」を参照してください。

`vucmmd` デーモンの開始の失敗

複数所有者ボリュームマネージャーのフレームワークのデーモン、vucmmd は、複数所有者ボリュームマネージャーのフレームワークの再構成を管理します。クラスタが起動または再起動すると、このデーモンは複数所有者ボリュームマネージャーのフレームワークのすべてのコンポーネントが検証されてから開始されます。ノード上のコンポーネントの検証に失敗すると、vucmmd デーモンはそのノード上で開始できません。

この問題のもっとも一般的な原因は次のとおりです。

複数所有者ボリュームマネージャーのフレームワークのコンポーネントの以前の再構成中に、エラーが発生した。
複数所有者ボリュームマネージャーのフレームワークの以前の再構成のステップがタイムアウトし、タイムアウトが生じたノードでパニックが発生した。

問題を修正する手順については、「vucmmd デーモンまたは関連コンポーネントの障害から回復する」を参照してください。

`vucmmd` デーモンまたは関連コンポーネントの障害から回復する

次の節で説明した問題を修正するには、この作業を実行します。

「複数所有者ボリュームマネージャーフレームワークの初期化中のノードパニック」
「vucmmd デーモンの開始の失敗」

問題の原因を特定するには、複数所有者ボリュームマネージャーのフレームワークの再構成のログファイルとシステムメッセージファイルを調べます。
複数所有者ボリュームマネージャーのフレームワークの再構成のログファイルの場所については、「診断情報のソース」を参照してください。
これらのファイルを調べるときは、最新のメッセージから始め、問題の原因を特定するまで遡ります。
再構成エラーの原因を示している可能性のあるエラーメッセージについては、『Oracle Solaris Cluster Error Messages Guide 』を参照してください。
コンポーネントが複数所有者ボリュームマネージャーのフレームワークにエラーを返す原因となった問題を修正します。
たとえば、次のように使用します。
- VxVM のライセンスが見つからないか期限が切れている場合は、VxVM を正しくインストールし、ライセンスを取得します。
  1. ボリュームマネージャーパッケージを正しくインストールしてあることを確認します。
  2. VxVM を使用している場合は、ソフトウェアをインストールしてあることと、VxVM クラスタ機能のライセンスが有効であることを確認します。
  注 - ゾーンクラスタでは VxVM はサポートされません。
- 再構成ステップがタイムアウトした場合は、ステップのタイムアウトを指定する拡張プロパティーの値を増やします。
  詳細は、「タイムアウトによって起こるノードパニック」を参照してください。
問題に対する解決方法で再起動が必要な場合は、問題が発生したノードを再起動します。
特定の問題に対する解決方法でのみ、再起動が必要です。たとえば、共有メモリーの量を増やすには再起動が必要です。一方、ステップのタイムアウトの値を増やすには、再起動は必要ありません。
ノードを再起動する方法については、『Oracle Solaris Cluster システム管理』の「クラスタ内の 1 つのノードの停止と起動」を参照してください。
問題が発生したノードで、複数所有者ボリュームマネージャーのフレームワークリソースグループをオフラインにしてからオンラインにします。
このステップにより、構成変更を加えたリソースグループが更新されます。
1. スーパーユーザーになるか、RBAC の承認 solaris.cluster.admin を提供する役割になります。
2. 複数所有者ボリュームマネージャーのフレームワークリソースグループとそのリソースをオフラインにするコマンドを入力します。
```
# clresourcegroup offline -n node vucmm-fmwk-rg
```
  -n node
  
  問題が発生したノードのノード名とノード識別子 (ID) を指定します。
  
  vucmm-fmwk-rg
  
  オフラインにするリソースグループの名前を指定します。
3. 複数所有者ボリュームマネージャーのフレームワークリソースグループとそのリソースをオンラインおよび管理状態にするコマンドを入力します。
```
# clresourcegroup online -emM -n node vucmm-fmwk-rg
```

登録ファイルが見つからないため、SUNW.qfs の登録が失敗

Oracle Solaris Cluster のリソースタイプ登録ファイルは、/opt/cluster/lib/rgm/rtreg/ または /usr/cluster/lib/rgm/rtreg/ ディレクトリにあります。 SUNW.qfs リソースタイプ登録ファイルは、/opt/SUNWsamfs/sc/etc/ ディレクトリにあります。

Sun QFS ソフトウェアのインストール時に Oracle Solaris Cluster ソフトウェアがすでにインストールされている場合は、SUNW.qfs 登録ファイルへの必要なマッピングが自動的に作成されます。一方、Sun QFS ソフトウェアのインストール時に Oracle Solaris Cluster ソフトウェアがまだインストールされていない場合、Sun Cluster ソフトウェアをあとでインストールしても、SUNW.qfs 登録ファイルへの必要なマッピングは作成されません。 Oracle Solaris Cluster ソフトウェアがその登録ファイルの場所を認識しないため、SUNW.qfs リソースタイプを登録しようとすると失敗します。

Oracle Solaris Cluster ソフトウェアが SUNW.qfs リソースタイプの場所を特定できるようにするには、そのディレクトリへのシンボリックリンクを作成します。

# cd /usr/cluster/lib/rgm/rtreg
# ln -s /opt/SUNWsamfs/sc/etc/SUNW.qfs SUNW.qfs

タイムアウトによって起こるノードパニック

Oracle RAC 用サポートの再構成のステップのいずれかがタイムアウトすると、タイムアウトが生じたノードでパニックが発生します。

再構成ステップがタイムアウトしないようにするには、クラスタ構成に依存するタイムアウトを調整します。詳細は、「タイムアウトの設定のガイドライン」を参照してください。

再構成ステップがタイムアウトした場合は、Oracle Solaris Cluster メンテナンスコマンドを使用して、ステップのタイムアウトを指定する拡張プロパティーの値を増やします。詳細は、付録 C Oracle RAC 用サポート拡張プロパティーを参照してください。

拡張プロパティーの値を増やしたあと、パニックが発生したノードで RAC フレームワークリソースグループをオンラインにします。

`SUNW.rac_framework` または `SUNW.vucmm_framework` リソースの起動の失敗

SUNW.rac_framework または SUNW.vucmm_framework リソースが起動に失敗した場合は、リソースの状態を確認して失敗の原因を特定します。詳細は、「Oracle RAC 用サポートの状態を確認する」を参照してください。

起動に失敗したリソースの状態は、Start failed として示されます。関連付けられた状態メッセージには、起動に失敗した原因が示されます。

この節には次の情報が含まれます。

`SUNW.rac_framework` 起動失敗状態メッセージ

次の状態メッセージは、SUNW.rac_framework リソースの起動の失敗と関連付けられています。

Faulted - ucmmd is not running

説明: リソースのあるノードで、ucmmd デーモンが実行されていません。

対処方法: この問題の修正方法については、「ucmmd デーモンの開始の失敗」を参照してください。

Degraded - reconfiguration in progress

説明: UCMM が再構成中です。このメッセージが問題を示すのは、UCMM の再構成が完了しておらず、このリソースの状態が持続的に低下したままになっている場合のみです。

原因: このメッセージが問題を示す場合、失敗の原因は Oracle RAC 用サポートの 1 つ以上のコンポーネントの構成エラーです。

対処方法: この問題の解決方法は、メッセージが問題を示しているかどうかによって異なります。

メッセージが問題を示している場合は、「ucmmd デーモンまたは関連コンポーネントの障害から回復する」で説明されている問題を修正してください。
メッセージが問題を示していない場合、何もする必要はありません。

Online

説明: SUNW.rac_framework リソースの START メソッドがタイムアウトするまでに、Oracle RAC の再構成が完了しませんでした。

対処方法: 問題を修正する手順については、「START メソッドのタイムアウトから回復する」を参照してください。

`SUNW.vucmm_framework` 起動失敗状態メッセージ

次の状態メッセージは、SUNW.vucmm_framework リソースの起動の失敗と関連付けられています。

Faulted - vucmmd is not running

説明: リソースのあるノードで、vucmmd デーモンが実行されていません。

対処方法: この問題の修正方法については、「vucmmd デーモンの開始の失敗」を参照してください。

Degraded - reconfiguration in progress

説明: 複数所有者ボリュームマネージャーのフレームワークが再構成中です。このメッセージが問題を示すのは、複数所有者ボリュームマネージャーのフレームワークの再構成が完了しておらず、このリソースの状態が持続的に低下したままになっている場合のみです。

原因: このメッセージが問題を示す場合、失敗の原因はボリュームマネージャー再構成フレームワークの 1 つ以上のコンポーネントの構成エラーです。

対処方法: この問題の解決方法は、メッセージが問題を示しているかどうかによって異なります。

メッセージが問題を示している場合は、「vucmmd デーモンまたは関連コンポーネントの障害から回復する」で説明されている問題を修正してください。
メッセージが問題を示していない場合、何もする必要はありません。

Online

説明: SUNW.vucmm_framework リソースの START メソッドがタイムアウトするまでに、Oracle RAC の再構成が完了しませんでした。

対処方法: 問題を修正する手順については、「START メソッドのタイムアウトから回復する」を参照してください。

`START` メソッドのタイムアウトから回復する

スーパーユーザーになるか、RBAC の承認 solaris.cluster.admin を提供する役割になります。
START メソッドがタイムアウトしたノードで、起動に失敗したフレームワークリソースグループをオフラインにします。
この操作を実行するには、リソースグループの主ノードを、グループがオンラインになっている他のノードに切り替えます。
```
# clresourcegroup offline -n nodelist resource-group
```
-n nodelist

resource-group がオンラインになっている他のクラスタノードのコンマ区切りリストを指定します。 START メソッドがタイムアウトしたノードは、このリストから外します。

resource-group

フレームワークリソースグループの名前を指定します。
構成で複数所有者ボリュームマネージャーのフレームワークリソースグループと RAC フレームワークのリソースグループの両方が使用されている場合は、最初に複数所有者ボリュームマネージャーのフレームワークリソースグループをオフラインにします。複数所有者ボリュームマネージャーのフレームワークリソースグループをオフラインにしたあと、RAC フレームワークのリソースグループをオフラインにします。
RAC リソースグループが clsetup ユーティリティーを使用して作成された場合、リソースグループの名前は rac-framework-rg になります。
Oracle RAC 用サポートを実行可能なすべてのクラスタノードで、オンラインにすることのできなかったフレームワークリソースグループをオンラインにします。
```
# clresourcegroup online resource-group
```
resource-group

手順 2 でオフラインにしたリソースグループを MANAGED 状態にしてオンラインにするように指定します。

リソースの停止の失敗

リソースの停止に失敗した場合は、『Oracle Solaris Cluster Data Services Planning and Administration Guide』の「Clearing the STOP_FAILED Error Flag on Resources」で説明されている問題を修正します。

ナビゲーションリンクをスキップ
印刷ビューの終了
	Oracle Solaris Cluster Data Service for Oracle Real Application Clusters ガイド

一般的な問題と解決方法

RAC フレームワークリソースグループの障害

Oracle RAC 用サポート の初期化中のノードパニック

ucmmd デーモンの開始の失敗

ucmmd デーモンまたは関連コンポーネントの障害から回復する