Sun Cluster Data Service for Oracle Parallel Server/Real Application Clusters ガイド (Solaris OS 版)

第 3 章 Sun Cluster Support for Oracle Parallel Server/Real Application Clusters での問題の解決

Sun Cluster Support for Oracle Parallel Server/Real Application Clusters で問題が起きた場合は、以下の各節で説明するテクニックを使って問題を解決してください。

Sun Cluster Support for Oracle Parallel Server/Real Application Clusters の状態の確認

状態 SUNW.rac_framework リソースは、Sun Cluster Support for Oracle Parallel Server/Real Application Clusters の状態を表します。 Sun Cluster システム管理ツール scstat(1M) により、このリソースの状態を取得できます。

Sun Cluster Support for Oracle Parallel Server/Real Application Clusters の状態を確認する

  1. スーパーユーザーになります。

  2. 次のコマンドを入力します。


    # scstat -g
    

次の例は、障害のある RAC フレームワークリソースグループの状態を示しています。


例 3–1 障害のある RAC フレームワークリソースグループの状態


-- Resource Groups and Resources --

            Group Name        Resources
            ----------        ---------
 Resources: rac-framework-rg  rac_framework rac_udlm rac_cvm


-- Resource Groups --

            Group Name        Node Name  State
            ----------        ---------  -----
     Group: rac-framework-rg  node1      Online faulted
     Group: rac-framework-rg  node2      Online


-- Resources --

            Resource Name     Node Name  State     Status Message
            -------------     ---------  -----     --------------
  Resource: rac_framework     node1      Start failed Degraded - reconfiguration in progress
  Resource: rac_framework     node2      Online    Online

  Resource: rac_udlm          node1      Offline   Unknown - RAC framework is running
  Resource: rac_udlm          node2      Online    Online

  Resource: rac_cvm           node1      Offline   Unknown - RAC framework is running
  Resource: rac_cvm           node2      Online    Online

この例は、次の 2 つのノード構成の Sun Cluster Support for Oracle Parallel Server/Real Application Clusters の RAC フレームワークリソースグループ内のリソースの状態を示しています。

この例では、以下の状態情報を提供しています。


下の例は、正しく動作している RAC フレームワークリソースグループの状態を示しています。


例 3–2 正しく動作している RAC フレームワークリソースグループの状態


-- Resource Groups and Resources --

            Group Name        Resources
            ----------        ---------
 Resources: rac-framework-rg  rac_framework rac_udlm rac_cvm


-- Resource Groups --

            Group Name        Node Name  State
            ----------        ---------  -----
     Group: rac-framework-rg  node1      Online
     Group: rac-framework-rg  node2      Online


-- Resources --

            Resource Name     Node Name  State     Status Message
            -------------     ---------  -----     --------------
  Resource: rac_framework     node1      Online    Online
  Resource: rac_framework     node2      Online    Online

  Resource: rac_udlm          node1      Online    Online
  Resource: rac_udlm          node2      Online    Online

  Resource: rac_cvm           node1      Online    Online
  Resource: rac_cvm           node2      Online    Online

この例は、次の 2 つのノード構成の Sun Cluster Support for Oracle Parallel Server/Real Application Clusters の RAC フレームワークリソースグループ内のリソースの状態を示しています。

この例は、この構成のすべてのリソースおよびリソースグループがオンラインであることを示しています。


診断情報の情報源

ディレクトリ /var/cluster/ucmm には、診断情報の以下の情報源が含まれています。

システムメッセージファイルには、診断情報も含まれます。

Sun Cluster Support for Oracle Parallel Server/Real Application Clusters で問題が発生した場合は、これらのファイルを参照して、問題の原因に関する情報を取得してください。

よくある問題と解決方法

Sun Cluster Support for Oracle Parallel Server/Real Application Clusters に影響する問題を以下に説明します。 以下の各項では、問題の原因と解決方法について説明しています。

Sun Cluster Support for Oracle Parallel Server/Real Application Clusters の初期化中のノードパニック

Sun Cluster Support for Oracle Parallel Server/Real Application Clusters の初期化中に重大な問題が起きた場合、次のようなエラーメッセージと共にノードパニックが発生します。


panic[cpu0]/thread=40037e60: Failfast: Aborting because "ucmmd" died 30 seconds ago

問題の原因を突き止めるには、システムメッセージファイルを調べてください。 この問題の最も一般的な原因は以下のとおりです。

  • VERITAS Volume Manager (VxVM) のライセンスがないか、または失効している。

  • Oracle UDLM を含む ORCLudlm パッケージがインストールされていない。

  • 共有メモリの容量不足のため Oracle UDLM を起動できない。

  • Oracle UDLM のバージョンが Sun Cluster Support for Oracle Parallel Server/Real Application Clusters のバージョンと互換性がない。

  • 再構成ステップがタイムアウトした。

この問題を解決するには、問題の原因の適切な回復手順を実行して、パニックを起こしたノードをリブートしてください。

タイムアウトによるノードパニック

Sun Cluster Support for Oracle Parallel Server/Real Application Clusters の再構成時にステップのタイムアウトが原因でタイムアウトが発生したノードでパニックが起きます。

再構成ステップのタイムアウトを防ぐには、使用するクラスタ構成に基づいてタイムアウト値を調整してください。 詳細は、 タイムアウト設定のガイドラインを参照してください。

再構成ステップがタイムアウトする場合は、scrgadm ユーティリティを使って、ステップのタイムアウトを指定する拡張プロパティの値を増やしてください。 詳細は、付録 A 「Sun Cluster Support for Oracle Parallel Server/Real Application Clusters 拡張プロパティ」を参照してください。

拡張プロパティの値を増やした後、パニックを起こしたノードをリブートします。

ucmmd デーモンの起動失敗

UCMM デーモン、 ucmmd は、Sun Cluster Support for Oracle Parallel Server/Real Application Clusters の再構成を管理します。 クラスタをブートまたはリブートするとき、このデーモンは、Sun Cluster Support for Oracle Parallel Server/Real Application Clusters のすべてのコンポーネントが検証された後にだけ起動されます。 ノード上のコンポーネントの検証が失敗した場合、 ucmmd はそのノード上で起動に失敗します。

問題の原因を突き止めるには、以下のファイルを調べてください。

この問題の最も一般的な原因は以下のとおりです。

この問題を解決するには、問題の原因の適切な回復手順を実行して、ucmmd の起動に失敗したノードをリブートしてください。

SUNW.rac_framework リソースの起動失敗

SUNW.rac_framework リソースが起動に失敗する場合は、障害の原因を調べるためにリソースの状態を確認してください。 詳細は、 Sun Cluster Support for Oracle Parallel Server/Real Application Clusters の状態を確認するを参照してください。

起動に失敗したリソースの状態は、 Start failed と表示されています。 起動失敗の原因を示す関連状態メッセージは、次のとおりです。


Faulted - ucmmd is not running

リソースがあるノード上でucmmd デーモンが実行されていません。 この問題の解決方法については、ucmmd デーモンの起動失敗 を参照してください。


Degraded - reconfiguration in progress

Sun Cluster Support for Oracle Parallel Server/Real Application Clusters の 1 つまたは複数のコンポーネントでエラーが起きました。

設定エラーの原因を突き止めるには、以下のファイルを調べてください。

  • UCMM 再構成ログファイル /var/cluster/ucmm/ucmm_reconf.log

  • システムメッセージファイル

構成エラーの原因を示すエラーメッセージの詳細については、『 Sun Cluster Error Messages Guide for Solaris OS』を参照してください。

この問題を解決するには、問題を引き起こした設定エラーを修正します。 次にエラーの起きたコンポーネントのあるノードをリブートします。


Online

SUNW.rac_framework リソースの START メソッドがタイムアウトするまで Oracle Parallel Server/Real Application Clusters の再構成は完了しませんでした。

この問題を修正する方法については、START メソッドのタイムアウトから回復する を参照してください。

START メソッドのタイムアウトから回復する

  1. スーパーユーザーになります。

  2. START メソッドがタイムアウトしたノード上で、RAC フレームワークリソースグループをオフラインにします。


    # scswitch -z -g resource-group -h nodelist
    
    -g resource-group

    RAC フレームワークリソースグループの名前を指定します。 このリソースグループが scsetup ユーティリティを使って作成された場合、リソースグループの名前は、rac-framework-rg です。

    -h nodelist

    resource-group がオンラインになっている他のクラスタノードのコンマで区切ったリストを指定します。

  3. Sun Cluster Support for Oracle Parallel Server/Real Application Clusters を実行できるすべてのクラスタノード上で、RAC フレームワーククラスタグループをオンラインにします。


    # scswitch -Z -g resource-group
    
    -Z

    リソースとモニターを使用可能にし、リソースグループを 管理 状態にし、オンラインにします。

    -g resource-group

    手順 2 でオフラインにしたリソースグループが管理状態に移行し、オンラインになるように指定します。

リソースの停止失敗

リソースの停止に失敗した場合、『Sun Cluster データサービスの計画と管理 (Solaris OS 版)』の「リソース上の STOP_FAILED エラーフラグのクリア」の説明にしたがって問題を修正してください。