JavaScript is required to for searching.
ナビゲーションリンクをスキップ
印刷ビューの終了
Oracle Solaris Cluster Data Service for Oracle Real Application Clusters ガイド
search filter icon
search icon

ドキュメントの情報

はじめに

1.  Oracle RAC 用サポート のインストール

2.  Oracle ファイル用ストレージの構成

3.  リソースグループの登録と構成

4.  クラスタでの Oracle RAC の実行

5.  Oracle RAC 用サポート の管理

6.  Oracle RAC 用サポート のトラブルシューティング

Oracle RAC 用サポート の状態の確認

Oracle RAC 用サポート の状態を確認する

Oracle RAC 用サポート の状態の例

診断情報のソース

一般的な問題と解決方法

RAC フレームワークリソースグループの障害

Oracle RAC 用サポート の初期化中のノードパニック

ucmmd デーモンの開始の失敗

ucmmd デーモンまたは関連コンポーネントの障害から回復する

複数所有者ボリュームマネージャーのフレームワークリソースグループの障害

複数所有者ボリュームマネージャーフレームワークの初期化中のノードパニック

vucmmd デーモンの開始の失敗

vucmmd デーモンまたは関連コンポーネントの障害から回復する

登録ファイルが見つからないため、SUNW.qfs の登録が失敗

タイムアウトによって起こるノードパニック

SUNW.rac_framework または SUNW.vucmm_framework リソースの起動の失敗

SUNW.rac_framework 起動失敗状態メッセージ

SUNW.vucmm_framework 起動失敗状態メッセージ

START メソッドのタイムアウトから回復する

リソースの停止の失敗

7.  Oracle RAC 用サポート の既存の構成の変更

8.  Oracle RAC 用サポート のアップグレード

A.  このデータサービスの構成例

B.  DBMS エラーおよび記録された警告用の事前設定アクション

C.  Oracle RAC 用サポート 拡張プロパティー

D.  コマンド行のオプション

索引

一般的な問題と解決方法

次の副節では、Oracle RAC 用サポート に影響を与える可能性のある問題について説明します。 それぞれの副節で、問題の原因とその問題の解決方法について説明します。

RAC フレームワークリソースグループの障害

この節では、RAC フレームワークリソースグループに影響を与える可能性のある問題について説明します。

Oracle RAC 用サポート の初期化中のノードパニック

Oracle RAC 用サポート の初期化中に致命的な問題が生じた場合、次のようなエラーメッセージとともにノードでパニックが発生します。

panic[cpu0]/thread=40037e60:Failfast:Aborting because "ucmmd" died 30 seconds ago

説明: 再構成中に、UCMM が制御するコンポーネントが UCMM にエラーを返しました。

原因: この問題のもっとも一般的な原因は次のとおりです。

再構成ステップがタイムアウトしたために、Oracle RAC 用サポート の初期化中にノードでパニックが発生する場合もあります。 詳細は、「タイムアウトによって起こるノードパニック」を参照してください。

対処方法: 問題を修正する手順については、ucmmd デーモンまたは関連コンポーネントの障害から回復する」を参照してください。


注 - ノードがグローバルクラスタの投票ノードであるときは、ノードパニックによってマシン全体が停止します。 ノードがゾーンクラスタノードであるときは、ノードパニックによって特定のゾーンのみが停止し、他のゾーンは影響を受けません。


ucmmd デーモンの開始の失敗

UCMM デーモン、ucmmd は、Oracle RAC 用サポート の再構成を管理します。 クラスタが起動または再起動すると、このデーモンは Oracle RAC 用サポート のすべてのコンポーネントが検証されてから開始されます。 ノード上のコンポーネントの検証に失敗すると、ucmmd デーモンはそのノード上で開始できません。

この問題のもっとも一般的な原因は次のとおりです。

問題を修正する手順については、ucmmd デーモンまたは関連コンポーネントの障害から回復する」を参照してください。

ucmmd デーモンまたは関連コンポーネントの障害から回復する

次の節で説明した問題を修正するには、この作業を実行します。

  1. 問題の原因を特定するには、UCMM 再構成のログファイルとシステムメッセージファイルを調べます。

    UCMM 再構成のログファイルの場所については、「診断情報のソース」を参照してください。

    これらのファイルを調べるときは、最新のメッセージから始め、問題の原因を特定するまで遡ります。

    再構成エラーの原因を示している可能性のあるエラーメッセージについては、『Oracle Solaris Cluster Error Messages Guide 』を参照してください。

  2. コンポーネントが UCMM にエラーを返す原因となった問題を修正します。

    たとえば、次のように使用します。

    • SPARC:使用している Oracle リリースで Oracle UDLM が必要で、Oracle UDLM が含まれる ORCLudlm パッケージがインストールされていない場合は、そのパッケージをインストールします。

      注 - Oracle UDLM は、実際に使用されるときにのみ必要です。


      1. Oracle UDLM ソフトウェアのインストールと構成の前の手順をすべて完了していることを確認します。

        完了する必要のある手順は表 1-1 に一覧表示されています。

      2. Oracle UDLM ソフトウェアが正しくインストールおよび構成されていることを確認します。

        詳細は、「SPARC: Oracle UDLM のインストール」を参照してください。

    • SPARC:Oracle UDLM のバージョンが Oracle RAC 用サポート のバージョンと互換性がない場合は、互換性のあるバージョンのパッケージをインストールします。

      詳細は、「SPARC: Oracle UDLM のインストール」を参照してください。

    • SPARC:共有メモリーの量が Oracle UDLM を起動させるには不十分である場合は、共有メモリーの量を増やします。

      詳細は、「グローバルクラスタで Oracle RAC ソフトウェアの共有メモリーを構成する」を参照してください。

    • 再構成ステップがタイムアウトした場合は、ステップのタイムアウトを指定する拡張プロパティーの値を増やします。

      詳細は、「タイムアウトによって起こるノードパニック」を参照してください。

  3. 問題に対する解決方法で再起動が必要な場合は、問題が発生したノードを再起動します。

    特定の問題に対する解決方法でのみ、再起動が必要です。 たとえば、共有メモリーの量を増やすには再起動が必要です。 一方、ステップのタイムアウトの値を増やすには、再起動は必要ありません

    ノードを再起動する方法については、『Oracle Solaris Cluster システム管理』の「クラスタ内の 1 つのノードの停止と起動」を参照してください。

  4. 問題が発生したノードで、RAC フレームワークリソースグループをオフラインにしてからオンラインにします。

    このステップにより、構成変更を加えたリソースグループが更新されます。

    1. スーパーユーザーになるか、RBAC の承認 solaris.cluster.admin を提供する役割になります。
    2. RAC フレームワークリソースグループとそのリソースをオフラインにするコマンドを入力します。
      # clresourcegroup offline -n node rac-fmwk-rg
      -n node

      問題が発生したノードのノード名とノード識別子 (ID) を指定します。

      rac-fmwk-rg

      オフラインにするリソースグループの名前を指定します。

    3. RAC フレームワークリソースグループとそのリソースをオンラインおよび管理状態にするコマンドを入力します。
      # clresourcegroup online -emM -n node rac-fmwk-rg

複数所有者ボリュームマネージャーのフレームワークリソースグループの障害

この節では、複数所有者ボリュームマネージャーのフレームワークリソースグループに影響を与える可能性のある問題について説明します。

複数所有者ボリュームマネージャーフレームワークの初期化中のノードパニック

複数所有者ボリュームマネージャーのフレームワークの初期化中に致命的な問題が生じた場合、次のようなエラーメッセージとともにノードでパニックが発生します。


注 - ノードがグローバルクラスタの投票ノードであるときは、ノードパニックによってマシン全体が停止します。


panic[cpu0]/thread=40037e60:Failfast:Aborting because "vucmmd" died 30 seconds ago

説明: 再構成中に、複数所有者ボリュームマネージャーのフレームワークが制御するコンポーネントが複数所有者ボリュームマネージャーのフレームワークにエラーを返しました。

原因: この問題のもっとも一般的な原因は、Veritas Volume Manager (VxVM) のライセンスが見つからないか期限が切れていることです。

再構成ステップがタイムアウトしたために、複数所有者ボリュームマネージャーのフレームワークの初期化中にノードでパニックが発生する場合もあります。 詳細は、「タイムアウトによって起こるノードパニック」を参照してください。

対処方法: 問題を修正する手順については、vucmmd デーモンまたは関連コンポーネントの障害から回復する」を参照してください。

vucmmd デーモンの開始の失敗

複数所有者ボリュームマネージャーのフレームワークのデーモン、vucmmd は、複数所有者ボリュームマネージャーのフレームワークの再構成を管理します。 クラスタが起動または再起動すると、このデーモンは複数所有者ボリュームマネージャーのフレームワークのすべてのコンポーネントが検証されてから開始されます。 ノード上のコンポーネントの検証に失敗すると、vucmmd デーモンはそのノード上で開始できません。

この問題のもっとも一般的な原因は次のとおりです。

問題を修正する手順については、vucmmd デーモンまたは関連コンポーネントの障害から回復する」を参照してください。

vucmmd デーモンまたは関連コンポーネントの障害から回復する

次の節で説明した問題を修正するには、この作業を実行します。

  1. 問題の原因を特定するには、複数所有者ボリュームマネージャーのフレームワークの再構成のログファイルとシステムメッセージファイルを調べます。

    複数所有者ボリュームマネージャーのフレームワークの再構成のログファイルの場所については、「診断情報のソース」を参照してください。

    これらのファイルを調べるときは、最新のメッセージから始め、問題の原因を特定するまで遡ります。

    再構成エラーの原因を示している可能性のあるエラーメッセージについては、『Oracle Solaris Cluster Error Messages Guide 』を参照してください。

  2. コンポーネントが複数所有者ボリュームマネージャーのフレームワークにエラーを返す原因となった問題を修正します。

    たとえば、次のように使用します。

    • VxVM のライセンスが見つからないか期限が切れている場合は、VxVM を正しくインストールし、ライセンスを取得します。
      1. ボリュームマネージャーパッケージを正しくインストールしてあることを確認します。
      2. VxVM を使用している場合は、ソフトウェアをインストールしてあることと、VxVM クラスタ機能のライセンスが有効であることを確認します。

      注 - ゾーンクラスタでは VxVM はサポートされません。


    • 再構成ステップがタイムアウトした場合は、ステップのタイムアウトを指定する拡張プロパティーの値を増やします。

      詳細は、「タイムアウトによって起こるノードパニック」を参照してください。

  3. 問題に対する解決方法で再起動が必要な場合は、問題が発生したノードを再起動します。

    特定の問題に対する解決方法でのみ、再起動が必要です。 たとえば、共有メモリーの量を増やすには再起動が必要です。 一方、ステップのタイムアウトの値を増やすには、再起動は必要ありません

    ノードを再起動する方法については、『Oracle Solaris Cluster システム管理』の「クラスタ内の 1 つのノードの停止と起動」を参照してください。

  4. 問題が発生したノードで、複数所有者ボリュームマネージャーのフレームワークリソースグループをオフラインにしてからオンラインにします。

    このステップにより、構成変更を加えたリソースグループが更新されます。

    1. スーパーユーザーになるか、RBAC の承認 solaris.cluster.admin を提供する役割になります。
    2. 複数所有者ボリュームマネージャーのフレームワークリソースグループとそのリソースをオフラインにするコマンドを入力します。
      # clresourcegroup offline -n node vucmm-fmwk-rg
      -n node

      問題が発生したノードのノード名とノード識別子 (ID) を指定します。

      vucmm-fmwk-rg

      オフラインにするリソースグループの名前を指定します。

    3. 複数所有者ボリュームマネージャーのフレームワークリソースグループとそのリソースをオンラインおよび管理状態にするコマンドを入力します。
      # clresourcegroup online -emM -n node vucmm-fmwk-rg

登録ファイルが見つからないため、SUNW.qfs の登録が失敗

Oracle Solaris Cluster のリソースタイプ登録ファイルは、/opt/cluster/lib/rgm/rtreg/ または /usr/cluster/lib/rgm/rtreg/ ディレクトリにあります。 SUNW.qfs リソースタイプ登録ファイルは、/opt/SUNWsamfs/sc/etc/ ディレクトリにあります。

Sun QFS ソフトウェアのインストール時に Oracle Solaris Cluster ソフトウェアがすでにインストールされている場合は、SUNW.qfs 登録ファイルへの必要なマッピングが自動的に作成されます。 一方、Sun QFS ソフトウェアのインストール時に Oracle Solaris Cluster ソフトウェアがまだインストールされていない場合、Sun Cluster ソフトウェアをあとでインストールしても、SUNW.qfs 登録ファイルへの必要なマッピングは作成されません。 Oracle Solaris Cluster ソフトウェアがその登録ファイルの場所を認識しないため、SUNW.qfs リソースタイプを登録しようとすると失敗します。

Oracle Solaris Cluster ソフトウェアが SUNW.qfs リソースタイプの場所を特定できるようにするには、そのディレクトリへのシンボリックリンクを作成します。

# cd /usr/cluster/lib/rgm/rtreg
# ln -s /opt/SUNWsamfs/sc/etc/SUNW.qfs SUNW.qfs

タイムアウトによって起こるノードパニック

Oracle RAC 用サポート の再構成のステップのいずれかがタイムアウトすると、タイムアウトが生じたノードでパニックが発生します。

再構成ステップがタイムアウトしないようにするには、クラスタ構成に依存するタイムアウトを調整します。 詳細は、「タイムアウトの設定のガイドライン」を参照してください。

再構成ステップがタイムアウトした場合は、Oracle Solaris Cluster メンテナンスコマンドを使用して、ステップのタイムアウトを指定する拡張プロパティーの値を増やします。 詳細は、付録 C Oracle RAC 用サポート 拡張プロパティーを参照してください。

拡張プロパティーの値を増やしたあと、パニックが発生したノードで RAC フレームワークリソースグループをオンラインにします。

SUNW.rac_framework または SUNW.vucmm_framework リソースの起動の失敗

SUNW.rac_framework または SUNW.vucmm_framework リソースが起動に失敗した場合は、リソースの状態を確認して失敗の原因を特定します。 詳細は、「Oracle RAC 用サポート の状態を確認する」を参照してください。

起動に失敗したリソースの状態は、Start failed として示されます。 関連付けられた状態メッセージには、起動に失敗した原因が示されます。

この節には次の情報が含まれます。

SUNW.rac_framework 起動失敗状態メッセージ

次の状態メッセージは、SUNW.rac_framework リソースの起動の失敗と関連付けられています。

Faulted - ucmmd is not running

説明: リソースのあるノードで、ucmmd デーモンが実行されていません。

対処方法: この問題の修正方法については、ucmmd デーモンの開始の失敗」を参照してください。

Degraded - reconfiguration in progress

説明: UCMM が再構成中です。 このメッセージが問題を示すのは、UCMM の再構成が完了しておらず、このリソースの状態が持続的に低下したままになっている場合のみです。

原因: このメッセージが問題を示す場合、失敗の原因は Oracle RAC 用サポート の 1 つ以上のコンポーネントの構成エラーです。

対処方法: この問題の解決方法は、メッセージが問題を示しているかどうかによって異なります。

Online

説明: SUNW.rac_framework リソースの START メソッドがタイムアウトするまでに、Oracle RAC の再構成が完了しませんでした。

対処方法: 問題を修正する手順については、START メソッドのタイムアウトから回復する」を参照してください。

SUNW.vucmm_framework 起動失敗状態メッセージ

次の状態メッセージは、SUNW.vucmm_framework リソースの起動の失敗と関連付けられています。

Faulted - vucmmd is not running

説明: リソースのあるノードで、vucmmd デーモンが実行されていません。

対処方法: この問題の修正方法については、vucmmd デーモンの開始の失敗」を参照してください。

Degraded - reconfiguration in progress

説明: 複数所有者ボリュームマネージャーのフレームワークが再構成中です。 このメッセージが問題を示すのは、複数所有者ボリュームマネージャーのフレームワークの再構成が完了しておらず、このリソースの状態が持続的に低下したままになっている場合のみです。

原因: このメッセージが問題を示す場合、失敗の原因はボリュームマネージャー再構成フレームワークの 1 つ以上のコンポーネントの構成エラーです。

対処方法: この問題の解決方法は、メッセージが問題を示しているかどうかによって異なります。

Online

説明: SUNW.vucmm_framework リソースの START メソッドがタイムアウトするまでに、Oracle RAC の再構成が完了しませんでした。

対処方法: 問題を修正する手順については、START メソッドのタイムアウトから回復する」を参照してください。

START メソッドのタイムアウトから回復する

  1. スーパーユーザーになるか、RBAC の承認 solaris.cluster.admin を提供する役割になります。
  2. START メソッドがタイムアウトしたノードで、起動に失敗したフレームワークリソースグループをオフラインにします。

    この操作を実行するには、リソースグループの主ノードを、グループがオンラインになっている他のノードに切り替えます。

    # clresourcegroup offline -n nodelist resource-group
    -n nodelist

    resource-group がオンラインになっている他のクラスタノードのコンマ区切りリストを指定します。 START メソッドがタイムアウトしたノードは、このリストから外します。

    resource-group

    フレームワークリソースグループの名前を指定します。

    構成で複数所有者ボリュームマネージャーのフレームワークリソースグループと RAC フレームワークのリソースグループの両方が使用されている場合は、最初に複数所有者ボリュームマネージャーのフレームワークリソースグループをオフラインにします。 複数所有者ボリュームマネージャーのフレームワークリソースグループをオフラインにしたあと、RAC フレームワークのリソースグループをオフラインにします。

    RAC リソースグループが clsetup ユーティリティーを使用して作成された場合、リソースグループの名前は rac-framework-rg になります。

  3. Oracle RAC 用サポート を実行可能なすべてのクラスタノードで、オンラインにすることのできなかったフレームワークリソースグループをオンラインにします。
    # clresourcegroup online resource-group
    resource-group

    手順 2 でオフラインにしたリソースグループを MANAGED 状態にしてオンラインにするように指定します。

リソースの停止の失敗

リソースの停止に失敗した場合は、『Oracle Solaris Cluster Data Services Planning and Administration Guide』の「Clearing the STOP_FAILED Error Flag on Resources」で説明されている問題を修正します。