JavaScript is required to for searching.
ナビゲーションリンクをスキップ
印刷ビューの終了
Oracle Solaris Cluster Data Service for Oracle Real Application Clusters ガイド     Oracle Solaris Cluster 4.0 (日本語)
search filter icon
search icon

ドキュメントの情報

はじめに

1.  Oracle RAC のサポート のインストール

2.  Oracle ファイル用のストレージの構成

3.  リソースグループの登録と構成

4.  クラスタでの Oracle RAC の実行の有効化

5.  Oracle RAC のサポート の管理

6.  Oracle RAC のサポート のトラブルシューティング

Oracle RAC のサポート のステータスの検証

Oracle RAC のサポート のステータスを検証する方法

診断情報のソース

一般的な問題とその解決方法

Oracle RAC フレームワークリソースグループの障害

Oracle RAC のサポート の初期化中のノードパニック

ucmmd デーモンの開始の失敗

ucmmd デーモンまたは関連コンポーネントの障害から回復する方法

複数所有者ボリュームマネージャーのフレームワークリソースグループの障害

複数所有者ボリュームマネージャーフレームワークの初期化中のノードパニック

vucmmd デーモンの開始の失敗

vucmmd デーモンまたは関連コンポーネントの障害から回復する方法

タイムアウトによって発生するノードパニック

SUNW.rac_framework または SUNW.vucmm_framework リソースの開始の失敗

SUNW.rac_framework の起動失敗ステータスメッセージ

SUNW.vucmm_framework の起動失敗ステータスメッセージ

START メソッドのタイムアウトから回復する方法

リソースの停止の失敗

7.  Oracle RAC のサポートの既存の構成の変更

A.  このデータサービスの構成例

B.  DBMS のエラーおよび記録される警告についての事前設定アクション

C.  Oracle RAC のサポート 拡張プロパティー

D.  コマンド行のオプション

索引

一般的な問題とその解決方法

以降のサブセクションでは、Oracle RAC のサポート に影響を与える可能性がある問題について説明します。各サブセクションで、問題の原因と問題の解決方法について説明します。

Oracle RAC フレームワークリソースグループの障害

このセクションでは、Oracle RAC フレームワークリソースグループに影響を与える可能性がある問題について説明します。

Oracle RAC のサポート の初期化中のノードパニック

Oracle RAC のサポート の初期化中に致命的な問題が発生した場合は、次のエラーメッセージと同様のエラーメッセージとともにノードでパニックが発生します。

panic[cpu0]/thread=40037e60: Failfast: Aborting because "ucmmd" died 30 seconds ago

説明: 再構成中に、UCMM が制御するコンポーネントが UCMM にエラーを返しました。

原因: この問題のもっとも一般的な原因は次のとおりです。

再構成の手順がタイムアウトしたために、Oracle RAC のサポート の初期化中にノードでパニックが発生する場合もあります。詳細は、「タイムアウトによって発生するノードパニック」を参照してください。

対処方法: この問題を修正する手順については、ucmmd デーモンまたは関連コンポーネントの障害から回復する方法」を参照してください。


注 - ノードがグローバルクラスタのグローバルクラスタ投票ノードである場合は、ノードパニックによってマシン全体が停止します。ノードがゾーンクラスタノードである場合は、ノードパニックによってその特定のゾーンだけが停止し、ほかのゾーンは影響を受けません。


ucmmd デーモンの開始の失敗

UCMM デーモン ucmmd は、Oracle RAC のサポート の再構成を管理します。クラスタがブートまたはリブートされると、このデーモンは Oracle RAC のサポート のすべてのコンポーネントが検証されてから開始されます。ノード上のコンポーネントの検証に失敗すると、そのノード上では ucmmd デーモンが開始されません。

この問題のもっとも一般的な原因は次のとおりです。

この問題を修正する手順については、ucmmd デーモンまたは関連コンポーネントの障害から回復する方法」を参照してください。

ucmmd デーモンまたは関連コンポーネントの障害から回復する方法

次のセクションで説明する問題を修正するには、このタスクを実行します。

  1. 問題の原因を判定するため、UCMM 再構成のログファイルとシステムメッセージファイルを調べます。

    UCMM 再構成のログファイルの場所については、「診断情報のソース」を参照してください。

    これらのファイルを調べるときは、最新のメッセージから始めて、問題の原因が特定されるまで過去にさかのぼります。

    再構成エラーの原因を示している可能性があるエラーメッセージについては、『Oracle Solaris Cluster Error Messages Guide 』を参照してください。

  2. コンポーネントが UCMM にエラーを返す原因となった問題を修正します。

    例:

  3. 問題の解決方法でリブートが必要な場合は、問題が発生したノードをリブートします。

    特定の問題の解決方法でのみ、リブートが必要です。たとえば、共有メモリーの量を増やす場合は、リブートが必要です。しかし、手順のタイムアウトの値を増やす場合は、リブートは必要ありません

    ノードをリブートする方法については、『Oracle Solaris Cluster システム管理』の「クラスタ内の 1 つのノードの停止と起動」を参照してください。

  4. 問題が発生したノード上で、Oracle RAC フレームワークリソースグループをオフラインにしてからオンラインにします。

    この手順により、構成変更を加えたリソースグループが更新されます。

    1. スーパーユーザーになるか、RBAC の承認 solaris.cluster.admin を提供する役割になります。
    2. Oracle RAC フレームワークリソースグループとそのリソースをオフラインにするコマンドを入力します。
      # clresourcegroup offline -n node rac-fmwk-rg
      -n node

      問題が発生したノードのノード名とノード識別子 (ID) を指定します。

      rac-fmwk-rg

      オフラインにするリソースグループの名前を指定します。

    3. Oracle RAC フレームワークリソースグループとそのリソースをオンラインおよび管理状態にするコマンドを入力します。
      # clresourcegroup online -emM -n node rac-fmwk-rg

複数所有者ボリュームマネージャーのフレームワークリソースグループの障害

このセクションでは、複数所有者ボリュームマネージャーのフレームワークリソースグループに影響を与える可能性がある問題について説明します。

複数所有者ボリュームマネージャーフレームワークの初期化中のノードパニック

複数所有者ボリュームマネージャーフレームワークの初期化中に致命的な問題が発生した場合は、次のようなエラーメッセージとともにノードでパニックが発生します。


注 - ノードがグローバルクラスタのグローバルクラスタ投票ノードである場合は、ノードパニックによってマシン全体が停止します。


vucmmd デーモンの開始の失敗

複数所有者ボリュームマネージャーフレームワークのデーモン vucmmd は、複数所有者ボリュームマネージャーフレームワークの再構成を管理します。クラスタがブートまたはリブートされると、このデーモンは複数所有者ボリュームマネージャーフレームワークのすべてのコンポーネントが検証されてから開始されます。ノード上のコンポーネントの検証に失敗すると、そのノード上では vucmmd デーモンが開始されません。

この問題のもっとも一般的な原因は次のとおりです。

この問題を修正する手順については、vucmmd デーモンまたは関連コンポーネントの障害から回復する方法」を参照してください。

vucmmd デーモンまたは関連コンポーネントの障害から回復する方法

次のセクションで説明する問題を修正するには、このタスクを実行します。

  1. 問題の原因を判定するため、複数所有者ボリュームマネージャーフレームワーク再構成のログファイルとシステムメッセージファイルを調べます。

    複数所有者ボリュームマネージャーフレームワーク再構成のログファイルの場所については、「診断情報のソース」を参照してください。

    これらのファイルを調べるときは、最新のメッセージから始めて、問題の原因が特定されるまで過去にさかのぼります。

    再構成エラーの原因を示している可能性があるエラーメッセージについては、『Oracle Solaris Cluster Error Messages Guide 』を参照してください。

  2. コンポーネントが複数所有者ボリュームマネージャーフレームワークにエラーを返す原因となった問題を修正します。
  3. 問題の解決方法でリブートが必要な場合は、問題が発生したノードをリブートします。

    特定の問題の解決方法でのみ、リブートが必要です。たとえば、共有メモリーの量を増やす場合は、リブートが必要です。しかし、手順のタイムアウトの値を増やす場合は、リブートは必要ありません

    ノードをリブートする方法については、『Oracle Solaris Cluster システム管理』の「クラスタ内の 1 つのノードの停止と起動」を参照してください。

  4. 問題が発生したノード上で、複数所有者ボリュームマネージャーのフレームワークリソースグループをオフラインにしてからオンラインにします。

    この手順により、構成変更を加えたリソースグループが更新されます。

    1. スーパーユーザーになるか、RBAC の承認 solaris.cluster.admin を提供する役割になります。
    2. 複数所有者ボリュームマネージャーのフレームワークリソースグループとそのリソースをオフラインにするコマンドを入力します。
      # clresourcegroup offline -n node vucmm-fmwk-rg
      -n node

      問題が発生したノードのノード名とノード識別子 (ID) を指定します。

      vucmm-fmwk-rg

      オフラインにするリソースグループの名前を指定します。

    3. 複数所有者ボリュームマネージャーのフレームワークリソースグループとそのリソースをオンラインおよび管理状態にするコマンドを入力します。
      # clresourcegroup online -emM -n node vucmm-fmwk-rg

タイムアウトによって発生するノードパニック

Oracle RAC のサポート 再構成の手順のいずれかがタイムアウトすると、タイムアウトが発生したノードでパニックが発生します。

再構成の手順がタイムアウトしないようにするには、クラスタ構成に依存するタイムアウトを調整します。詳細は、「タイムアウト設定のガイドライン」を参照してください。

再構成の手順がタイムアウトした場合は、Oracle Solaris Cluster の保守コマンドを使用して、その手順のタイムアウトを指定する拡張プロパティーの値を増やします。詳細は、付録 C Oracle RAC のサポート 拡張プロパティーを参照してください。

拡張プロパティーの値を増やしたら、パニックが発生したノードで Oracle RAC フレームワークリソースグループをオンラインにします。

SUNW.rac_framework または SUNW.vucmm_framework リソースの開始の失敗

SUNW.rac_framework または SUNW.vucmm_framework リソースの起動に失敗した場合は、リソースのステータスを検証して、失敗の原因を判定します。詳細は、「Oracle RAC のサポート のステータスを検証する方法」を参照してください。

起動に失敗したリソースの状態は、「起動に失敗」として表示されます。関連付けられたステータスメッセージは、起動に失敗した原因を示します。

このセクションには、次の情報が含まれます。

SUNW.rac_framework の起動失敗ステータスメッセージ

次のステータスメッセージは、SUNW.rac_framework リソースの起動の失敗に関連付けられています。

Faulted - ucmmd is not running

説明: リソースが存在するノードで ucmmd デーモンが実行されていません。

対処方法: この問題の修正方法については、ucmmd デーモンの開始の失敗」を参照してください。

Degraded - reconfiguration in progress

説明: UCMM は再構成中です。このメッセージが問題を示すのは、UCMM の再構成が完了しておらず、このリソースのステータスが持続的に低下したままになっている場合だけです。

原因: このメッセージが問題を示す場合、失敗の原因は Oracle RAC のサポート の 1 つ以上のコンポーネントの構成エラーです。

対処方法: この問題の解決方法は、メッセージが問題を示しているかどうかによって異なります。

Online

説明: SUNW.rac_framework リソースの START メソッドがタイムアウトするまでに、Oracle RAC の再構成が完了しませんでした。

対処方法: この問題を修正する手順については、START メソッドのタイムアウトから回復する方法」を参照してください。

SUNW.vucmm_framework の起動失敗ステータスメッセージ

次のステータスメッセージは、SUNW.vucmm_framework リソースの起動の失敗に関連付けられています。

Faulted - vucmmd is not running

説明: リソースが存在するノードで vucmmd デーモンが実行されていません。

対処方法: この問題の修正方法については、vucmmd デーモンの開始の失敗」を参照してください。

Degraded - reconfiguration in progress

説明: 複数所有者ボリュームマネージャーフレームワークは再構成中です。このメッセージが問題を示すのは、複数所有者ボリュームマネージャーフレームワークの再構成が完了しておらず、このリソースのステータスが持続的に低下したままになっている場合だけです。

原因: このメッセージが問題を示す場合、失敗の原因は複数所有者ボリュームマネージャーフレームワークの 1 つ以上のコンポーネントの構成エラーです。

対処方法: この問題の解決方法は、メッセージが問題を示しているかどうかによって異なります。

Online

説明: SUNW.vucmm_framework リソースの START メソッドがタイムアウトするまでに、Oracle RAC の再構成が完了しませんでした。

対処方法: この問題を修正する手順については、START メソッドのタイムアウトから回復する方法」を参照してください。

START メソッドのタイムアウトから回復する方法

  1. スーパーユーザーになるか、RBAC の承認 solaris.cluster.admin を提供する役割になります。
  2. START メソッドがタイムアウトしたノードで、起動に失敗したフレームワークリソースグループをオフラインにします。

    この操作を実行するには、リソースグループのプライマリノードを、グループがオンラインになっているほかのノードに切り替えます。

    # clresourcegroup offline -n nodelist resource-group
    -n nodelist

    resource-group がオンラインになっているほかのクラスタノードのコンマ区切りリストを指定します。START メソッドがタイムアウトしたノードは、このリストから除外します。

    resource-group

    フレームワークリソースグループの名前を指定します。

    複数所有者ボリュームマネージャーのフレームワークリソースグループと Oracle RAC フレームワークリソースグループの両方が構成に使用されている場合は、最初に複数所有者ボリュームマネージャーのフレームワークリソースグループをオフラインにします。複数所有者ボリュームマネージャーのフレームワークリソースグループがオフラインになったら、次に Oracle RAC フレームワークリソースグループをオフラインにします。

    Oracle RAC フレームワークリソースグループが clsetup ユーティリティーを使用して作成された場合、リソースグループの名前は rac-framework-rg です。

  3. Oracle RAC のサポート を実行できるすべてのクラスタノードで、オンラインにすることができなかったフレームワークリソースグループをオンラインにします。
    # clresourcegroup online resource-group
    resource-group

    手順 2 でオフラインにしたリソースグループを MANAGED 状態にしてオンラインにするように指定します。

リソースの停止の失敗

リソースの停止に失敗した場合は、『Oracle Solaris Cluster Data Services Planning and Administration Guide』の「Clearing the STOP_FAILED Error Flag on Resources」の説明に従って問題を修正します。