Sun Cluster 2.2 のシステム管理

監視ユーティリティ

Sun Cluster 構成の監視を行うには、/var/adm/messages ファイルのほかに、Sun Cluster の hastat(1M) ユーティリティも使用できます。また、主要なクラスタコンポーネントとサブコンポーネントの状態を表示する Sun Cluster Manager GUI も使用できます。Sun Cluster Manager の詳細は、「Sun Cluster Manager による Sun Cluster サーバーの監視」を参照してください。Sun Cluster には、同時に最大 32 のクラスタを監視できる SNMP エージェントもあります。詳細は、付録 D 「Sun Cluster SNMP の使用」を参照してください。

Solstice DiskSuite が稼動している場合は、ディスクセットの状態監視に metastat(1M)、metadb(1M)、metatool(1M)、medstat(1M)、mdlogd(1M) ユーティリティも使用できます。SNMP ベースの Solstice DiskSuite ログデーモン、mdlogd(1M) は、Solstice DiskSuite が syslog ファイルにメッセージを記録する際に一般的な SNMP トラップを生成します。mdlogd.cf(4) 構成ファイルに正規表現を指定することにより、特定のメッセージが記録される場合だけ mdlogd(1M) がトラップを送信するように構成できます。トラップは、mdlogd.cf(4) 構成ファイルに指定された管理ホストに送信されます。管理ホストでは、Solstice SunNet Manager^TM のようなネットワーク管理アプリケーションが実行されていなければなりません。Solstice DiskSuite のエラーや警告を見つけるために定期的に metastat(1M) を実行したり、syslog 出力をスキャンしたりするのを避けたい場合は、mdlogd(1M) を使用できます。詳細は、mdlogd(1M) のマニュアルページを参照してください。

SSVM または CVM が稼動している場合は、vxprint、vxstat、vxtrace、vxnotify、vxva ユーティリティを使用できます。これらのユーティリティの詳細は、使用しているボリューム管理ソフトウェアのマニュアルを参照してください。

注 -

障害のあるコンポーネントの障害追跡と修復の詳細は、該当するハードウェアマニュアルを参照してください。

`hastat(1M)` による構成の監視

hastat(1M) プログラムは、構成の現在の状態を表示します。表示されるのは、ホスト、論理ホスト、プライベートネットワーク、パブリックネットワーク、データサービス、ローカルディスク、ディスクセットの状態に関する情報と、最新のエラーメッセージです。hastat(1M) プログラムは、/var/adm/messages ファイルから Sun Cluster 関連のエラーメッセージを抽出し、-m が指定されている場合は各ホストの最後の数メッセージを出力します。最新のエラーメッセージリストはログメッセージからの抜粋であるため、メッセージによっては前後関係がわからなくなることもあります。完全なメッセージリストは、/var/adm/messages ファイルで確認してください。次に、hastat(1M) の出力例を示します。

# hastat -m 10

 HIGH AVAILABILITY CONFIGURATION AND STATUS
 -------------------------------------------

 LIST OF NODES CONFIGURED IN <ha-host1> CLUSTER
       phys-host1 phys-host2

 CURRENT MEMBERS OF THE CLUSTER

      phys-host1 is a cluster member

      phys-host2 is a cluster member

 CONFIGURATION STATE OF THE CLUSTER

      Configuration State on phys-host1: Stable

      Configuration State on phys-host2: Stable

 UPTIME OF NODES IN THE CLUSTER

      uptime of phys-host1:         12:47pm  up 12 day(s), 21:11,  1 user,
 load average: 0.21, 0.15, 0.14

      uptime of phys-host2:         12:46pm  up 12 day(s),  3:15,  3 users,
 load average: 0.40, 0.20, 0.16

 LOGICAL HOSTS MASTERED BY THE CLUSTER MEMBERS

 Logical Hosts Mastered on phys-host1:
         ha-host-1
 Loghost Hosts for which phys-host1 is Backup Node:
         ha-host2

 Logical Hosts Mastered on phys-host2:
         ha-host2
 Loghost Hosts for which phys-host2 is Backup Node:
         ha-host1

 LOGICAL HOSTS IN MAINTENANCE STATE

      None

 STATUS OF PRIVATE NETS IN THE CLUSTER

      Status of Interconnects on phys-host1:
         interconnect0: selected
         interconnect1: up
      Status of private nets on phys-host1:
         To phys-host1 - UP
         To phys-host2 - UP

      Status of Interconnects on phys-host2:
         interconnect0: selected
         interconnect1: up
      Status of private nets on phys-host2:
         To phys-host1 - UP
         To phys-host2 - UP

 STATUS OF PUBLIC NETS IN THE CLUSTER

 Status of Public Network On phys-host1:

 bkggrp  r_adp   status  fo_time live_adp
 nafo0   le0     OK      NEVER   le0

 Status of Public Network On phys-host2:

 bkggrp  r_adp   status  fo_time live_adp
 nafo0   le0     OK      NEVER   le0

 STATUS OF SERVICES RUNNING ON LOGICAL HOSTS IN THE CLUSTER

        Status Of Registered Data Services
        q:                       Off
        p:                       Off
        nfs:                     On
        oracle:                  On
        dns:                     On
        nshttp:                  Off
        nsldap:                  On

       Status Of Data Services Running On phys-host1
       Data Service HA-NFS:
       On Logical Host ha-host1:      Ok
     
       Status Of Data Services Running On phys-host2
       Data Service HA-NFS:
       On Logical Host ha-host2:      Ok
       
        Data Service "oracle":
        Database Status on phys-host2:
        SC22FILE - running;

        No Status Method for Data Service "dns"

        RECENT  ERROR MESSAGES FROM THE CLUSTER

        Recent Error Messages on phys-host1
        ...
        Recent Error Messages on phys-host2
        ...

メッセージファイルの確認

Sun Cluster ソフトウェアは、コンソールにメッセージを出力するほかに、/var/adm/messages ファイルにメッセージを書き込みます。次に、ディスクエラーが発生した時に報告されるメッセージ例を示します。

...
 Jun 1 16:15:26 host1 unix: WARNING: /io-unit@f,e1200000/sbi@0.0/SUNW,pln@a0000000,741022/ssd@3,4(ssd49):  
 Jun 1 16:15:26 host1 unix: Error for command `write(I))' Err
 Jun 1 16:15:27 host1 unix: or Level: Fatal
 Jun 1 16:15:27 host1 unix: Requested Block 144004, Error Block: 715559
 Jun 1 16:15:27 host1 unix: Sense Key: Media Error
 Jun 1 16:15:27 host1 unix: Vendor `CONNER':
 Jun 1 16:15:27 host1 unix: ASC=0x10(ID CRC or ECC error),ASCQ=0x0,FRU=0x15
 ...

注 -

Solaris と Sun Cluster の両方のエラーメッセージが /var/adm/messages ファイルに書き込まれるために、/var ディレクトリが満杯になることがあります。この問題を修正する方法については、「/var ファイルシステムの管理」を参照してください。

高可用性データサービスのためのユーティリティ

Sun Cluster には、高可用性データサービスの構成と管理を行うユーティリティもあります。次に、これらのユーティリティを示します。詳細は、付録 B 「Sun Cluster マニュアルページのクイックリファレンス」を参照してください。

cconsole(1) - クラスタコンソール GUI を起動します。
ccp(1) - クラスタコントロールパネル GUI を起動します。
ctelnet(1) - telnet セッションを起動します。
crlogin(1) - rlogin セッションを起動します。
chosts(1) - クラスタ名を、そのクラスタに属するホストの一覧に展開します。
cports(1) - ホスト名を、host、node、port の 3 つに展開します。このユーティリティは、この 3 つの情報で返される端末サーバーを介して、指定されたホストのシリアルポートコンソールを識別するために、cconsole(1) によって使用されます。
scconf(1M) - 構成情報の作成または変更を行います。

監視ユーティリティ

hastat(1M) による構成の監視

メッセージファイルの確認

高可用性データサービスのためのユーティリティ

`hastat(1M)` による構成の監視