Sun Cluster 2.2 のシステム管理

監視ユーティリティ

Sun Cluster 構成の監視を行うには、/var/adm/messages ファイルのほかに、Sun Cluster の hastat(1M) ユーティリティも使用できます。また、主要なクラスタコンポーネントとサブコンポーネントの状態を表示する Sun Cluster Manager GUI も使用できます。Sun Cluster Manager の詳細は、「Sun Cluster Manager による Sun Cluster サーバーの監視」を参照してください。Sun Cluster には、同時に最大 32 のクラスタを監視できる SNMP エージェントもあります。詳細は、付録 C 「Sun Cluster SNMP の使用」を参照してください。

Solstice DiskSuite が稼動している場合は、ディスクセットの状態監視に metastat(1M)、metadb(1M)、metatool(1M)、medstat(1M)、mdlogd(1M) ユーティリティも使用できます。SNMP ベースの Solstice DiskSuite ログデーモン、mdlogd(1M) は、Solstice DiskSuite が syslog ファイルにメッセージを記録する際に一般的な SNMP トラップを生成します。mdlogd.cf(4) 構成ファイルに正規表現を指定することにより、特定のメッセージが記録される場合だけ mdlogd(1M) がトラップを送信するように構成できます。トラップは、mdlogd.cf(4) 構成ファイルに指定された管理ホストに送信されます。管理ホストでは、Solstice SunNet Manager^TM のようなネットワーク管理アプリケーションが実行されていなければなりません。Solstice DiskSuite のエラーや警告を見つけるために定期的に metastat(1M) を実行したり、syslog 出力をスキャンしたりするのを避けたい場合は、mdlogd(1M) を使用できます。詳細は、mdlogd(1M) のマニュアルページを参照してください。

VxVM が稼動している場合は、vxprint、vxstat、vxtrace、vxnotify、vxva ユーティリティを使用できます。これらのユーティリティの詳細は、使用しているボリューム管理ソフトウェアのマニュアルを参照してください。

注 -

障害のあるコンポーネントの障害追跡と修復の詳細は、該当するハードウェアマニュアルを参照してください。

`hastat(1M)` による構成の監視

hastat(1M) プログラムは、構成の現在の状態を表示します。表示されるのは、ホスト、論理ホスト、プライベートネットワーク、パブリックネットワーク、データサービス、ローカルディスク、ディスクセットの状態に関する情報と、最新のエラーメッセージです。hastat(1M) プログラムは、/var/adm/messages ファイルから Sun Cluster 関連のエラーメッセージを抽出し、-m が指定されている場合は各ホストの最後の数メッセージを出力します。最新のエラーメッセージリストはログメッセージからの抜粋であるため、メッセージによっては前後関係がわからなくなることもあります。完全なメッセージリストは、/var/adm/messages ファイルで確認してください。次に、hastat(1M) の出力例を示します。

# hastat -m 10
 
HIGH AVAILABILITY CONFIGURATION AND STATUS 
-------------------------------------------
 
LIST OF NODES CONFIGURED IN <ha-host1> CLUSTER
      phys-host1 phys-host2
 
CURRENT MEMBERS OF THE CLUSTER
 
     phys-host1 is a cluster member
     phys-host2 is a cluster member
 
CONFIGURATION STATE OF THE CLUSTER
 
     Configuration State on phys-host1: Stable
     Configuration State on phys-host2: Stable
 
UPTIME OF NODES IN THE CLUSTER
 
     uptime of phys-host1:         12:47pm  up 12 day(s), 21:11,  1 user, 
load average: 0.21, 0.15, 0.14
     uptime of phys-host2:         12:46pm  up 12 day(s),  3:15,  3 users, 
load average: 0.40, 0.20, 0.16

LOGICAL HOSTS MASTERED BY THE CLUSTER MEMBERS
 
Logical Hosts Mastered on phys-host1:
        ha-host-1
Loghost Hosts for which phys-host1 is Backup Node:
        ha-host2
 
Logical Hosts Mastered on phys-host2:
        ha-host2
Loghost Hosts for which phys-host2 is Backup Node:
        ha-host1
 
LOGICAL HOSTS IN MAINTENANCE STATE
 
     None
 
STATUS OF PRIVATE NETS IN THE CLUSTER
 
     Status of Interconnects on phys-host1:
        interconnect0: selected
        interconnect1: up
     Status of private nets on phys-host1:
        To phys-host1 - UP
        To phys-host2 - UP
 
     Status of Interconnects on phys-host2:
        interconnect0: selected
        interconnect1: up
     Status of private nets on phys-host2:
        To phys-host1 - UP
        To phys-host2 - UP
 
STATUS OF PUBLIC NETS IN THE CLUSTER
 
Status of Public Network On phys-host1:
 
bkggrp  r_adp   status  fo_time live_adp
nafo0   le0     OK      NEVER   le0
 
Status of Public Network On phys-host2:
 
bkggrp  r_adp   status  fo_time live_adp
nafo0   le0     OK      NEVER   le0

STATUS OF SERVICES RUNNING ON LOGICAL HOSTS IN THE CLUSTER
 
       Status Of Registered Data Services
       q:                       Off
       p:                       Off
       nfs:                     On
       oracle:                  On
       dns:                     On
       nshttp:                  Off
       nsldap:                  On
 
      Status Of Data Services Running On phys-host1
      Data Service HA-NFS: 
      On Logical Host ha-host1:      Ok
     
      Status Of Data Services Running On phys-host2
      Data Service HA-NFS: 
      On Logical Host ha-host2:      Ok
       
       Data Service "oracle":
       Database Status on phys-host2:
       SC22FILE - running; 
 
       No Status Method for Data Service "dns"
 
       RECENT  ERROR MESSAGES FROM THE CLUSTER
 
       Recent Error Messages on phys-host1
       ...
       Recent Error Messages on phys-host2
       ...

メッセージファイルの確認

Sun Cluster ソフトウェアは、コンソールにメッセージを出力するほかに、/var/adm/messages ファイルにメッセージを書き込みます。次に、ディスクエラーが発生した時に報告されるメッセージ例を示します。

...
 Jun 1 16:15:26 host1 unix: WARNING: /io-unit@f,e1200000/sbi@0.0/SUNW,pln@a0000000,741022/ssd@3,4(ssd49):  
 Jun 1 16:15:26 host1 unix: Error for command `write(I))' Err
 Jun 1 16:15:27 host1 unix: or Level: Fatal
 Jun 1 16:15:27 host1 unix: Requested Block 144004, Error Block: 715559
 Jun 1 16:15:27 host1 unix: Sense Key: Media Error
 Jun 1 16:15:27 host1 unix: Vendor `CONNER':
 Jun 1 16:15:27 host1 unix: ASC=0x10(ID CRC or ECC error),ASCQ=0x0,FRU=0x15
 ...

注 -

Solaris と Sun Cluster の両方のエラーメッセージが /var/adm/messages ファイルに書き込まれるために、/var ディレクトリが満杯になることがあります。この問題を修正する方法については、関連するマニュアルを参照してください。

高可用性データサービスのためのユーティリティ

Sun Cluster には、高可用性データサービスの構成と管理を行うユーティリティもあります。次に、これらのユーティリティを示します。詳細は、関連するマニュアルページを参照してください。

cconsole(1) - クラスタコンソール GUI を起動します。
ccp(1) - クラスタコントロールパネル GUI を起動します。
ctelnet(1) - telnet セッションを起動します。
crlogin(1) - rlogin セッションを起動します。
chosts(1) - クラスタ名を、そのクラスタに属するホストの一覧に展開します。
cports(1) - ホスト名を、host、node、port の 3 つに展開します。このユーティリティは、この 3 つの情報で返される端末サーバーを介して、指定されたホストのシリアルポートコンソールを識別するために、cconsole(1) によって使用されます。
scconf(1M) - 構成情報の作成または変更を行います。

監視ユーティリティ

hastat(1M) による構成の監視

メッセージファイルの確認

高可用性データサービスのためのユーティリティ

`hastat(1M)` による構成の監視