12 トラブルシューティングのヒント

ACSLS HA 8.4 は、Solaris 11.2 下の 2 ノードシステムで動作する ACSLS アプリケーションを、Solaris Cluster 4.2 の制御下にある IPMP および ZFS と統合したものです。

ACSLS が実行中であることの確認

ACSLS サービスがアクティブノードで実行されていることを確認するには、ユーザー acsss として次のコマンドを使用します。

# su - acsss
$ acsss status

1 つ以上のサービスが無効になっている場合、$ acsss enable を使用して有効にします。

ステータスの表示によって、1 つ以上の ACSLS サービスが保守モードになっていることが明らかになった場合、コマンド $ acsss l-status を実行します。

障害があるサービスのログファイルへのパスを探して、サービスが保守モードになっている理由を説明するヒントをそのログで確認します。

1 つ以上の ACSLS サービスが保守モードになっている場合、acsss コマンドを使用してそのサービスを無効にしてから有効にすることでクリアできます。

$ acsss shutdown
$ acsss enable

root として # svcadm clear <service name> を使用して、個々のサービスをクリアします。

根本的な障害を修正するまで、サービスはクリアされません。

問題の原因を明らかにする手段として、特定の動作ログも確認するべきです。これらの大部分は、$ACS_HOME/log ディレクトリにあります。

確認するべきプライマリログは acsss_event.log です。このログには、ACSLS の操作全体に関するほとんどのイベントが記録されます。

問題が ACSLS GUI または論理ライブラリの操作に関係している場合、関連するログは $ACS_HOME/log/sslm ディレクトリにあります。

ACSLS GUI および WebLogic の場合、AcslsDomain.logAdminServer.log、および gui_trace.logs を探してください。

WebLogic に関するインストールの問題は、weblogic.log にあります。

論理ライブラリの問題の場合、論理ライブラリの構成後に、slim_event.logssmce_stderr.log を調べます。

共有ディスクリソースへの接続の対処

  1. acsls-storage リソースがアクティブなクラスタノードに対してオンラインになっていることを確認します。

    # clrs status acsls-storage
    
  2. acsls-storage リソースがオンラインではない場合、アクティブノードでリソースが ZFS にマウントされているかどうかを確認します。

    # zpool status
    

    acslspool がアクティブノードでマウントされていない場合、スタンバイノードでマウントされているかどうかを確認します。

    # ssh standby hostname zpool status
    

    共有ディスクリソースがスタンバイノードでマウントされている場合、クラスタの制御をそのノードに切り替えます。

    # clrg switch -n standby hostname acsls-rg
    
  3. acslspool がアクティブノードでマウントされておらず、acsls-storage リソースがオフラインになっている場合、アクティブノードで acslspool を表示できるかどうかを確認します。

    # zpool import (no argument)
    

    注記:

    acsls-storage がオフラインになっている場合にのみ、この操作は機能します。オフラインにするには、コマンド clrs disable acsls-storage を使用します。

    アクティブノードから acslspool を表示できる場合、インポートを試行します。

    # zpool import -f acslspool
    

    import 操作が成功する場合、acsls-storage リソースを Solaris Cluster に対してオンラインにします。

    # clrs enable acsls-storage
    

    アクティブノードで acslspool を表示できない場合、共有ドライブへの物理接続をトラブルシューティングする必要があります。

論理ホストに ping できない場合

  1. 論理ホスト名が Solaris Cluster に登録されていることを確認します。

    # clrslh list
    
  2. アクティブノードを判別します。

    # clrg status | grep -i Online
    
  3. アクティブノードに ping できることを確認します。

    # ping <node name>
    
  4. logical-host 名前リソースがアクティブノードに対してオンラインになっていることを確認します。

    # clrslh status
    

    論理ホストがオンラインではない場合、有効にしてください。

    # clrs enable <logical host>
    
  5. パブリックグループに割り当てられた IP インタフェースの状態を確認します。

    # ipadm
    

    出力の表示で、パブリック ipmp グループの各メンバーの ok 状態を確認します。

  6. パブリックグループ (ipmp0) 内のインタフェースごとに、その物理的な状態を確認します。

    # dladm show-phys
    
  7. 論理ホストが、パブリック ipmp グループ内にある 2 つのインタフェースのいずれか (手順 5 で確認) に plumb されていることを確認します。

    # arp <logical-hostname>
    # ifconfig net0
    # ifconfig net4
    

    この例では、net0 と net4 がパブリック ipmp グループに割り当てられたことを想定しています。

    2 つのインタフェースのうちいずれかの MAC アドレスは、論理ホスト名に割り当てられた MAC アドレスと一致します。

ノード間の相互接続の確認

2 つのノード間の Cluster の通信が失われたためにクラスタの制御が失敗したと考えられる場合、次のようにして、Cluster のプライベート相互接続を確認します。

# cluster status -t interconnect