Sun Cluster 3.0 U1 系統管理手冊

第 1章 管理 Sun Cluster 簡介

本章提供如何準備管理叢集以及使用 Sun Cluster 管理工具的程序相關資訊。

以下是本章介紹的程序列表。

1.1 管理 Sun Cluster 概觀

Sun Cluster 為高度可用的環境,可確保一般使用者隨時可以使用重要的應用程式。系統管理員的工作是保證 Sun Cluster 穩定運轉。

在著手管理工作之前,您應該熟悉 Sun Cluster 3.0 U1 安裝手冊 中的規劃資訊以及 Sun Cluster 3.0 U1 概念 文件中的詞彙。Sun Cluster 管理共分成數項作業,並在下列手冊分別敘述:

在大部份情況下,您可以一面執行 Sun Cluster 管理作業,而叢集同時保持運轉且影響只限定於一個節點。對於需要關閉整個叢集才能執行的程序,請將關機時間排定下班後,以使對系統造成的影響降至最小。如果您計劃關閉叢集或叢集節點,請先通知使用者。

1.2 管理工具

您可以在 Sun Cluster 中使用圖形使用者介面 (Graphical User Interface,GUI) 或指令行來執行管理作業。本節提供這些工具的概觀。

1.2.1 圖形使用者介面

Sun Cluster 支援兩種圖形使用者介面 (GUI),讓您能夠在叢集上執行不同管理作業。這些 GUI 工具分別為 SunPlex Manager 及 Sun Management Center。請參閱 第 9章, 利用圖形使用者介面管理 Sun Cluster。,以取得有關 SunPlex Manager 和 Sun Management Center 的詳細資訊及其配置程序的說明。關於如何使用這些工具的具體說明,請參閱各個 GUI 的線上說明。

1.2.2 指令行介面

您可以透過 scsetup(1M) 公用程式以互動方式執行大部份的 Sun Cluster 管理作業。只要適當,本手冊中的管理程序都是使用 scsetup 來敘述。

您以可透過 scsetup 公用程式來管理以下項目:

以下列出您用來管理 Sun Cluster 的其他指令。請參閱線上援助頁,以取得詳細資訊。

表 1-1 Sun Cluster 指令行介面指令

指令 

說明 

ccp(1M)

啟動叢集的遠端主控台存取 

pmfadm(1M)

提供處理監控設備的管理存取權。 

pnmset(1M)

配置公用網路管理 (PNM)。 

pnmstat(1M)

報告由 PNM 監視的「網路卡故障轉移」(NAFO) 群組的狀態。 

sccheck(1M)

檢查並驗證 /etc/vfstab 檔中的整體裝載項目。

scconf(1M)

更新 Sun Cluster 配置。-p 選項可列出叢集配置資訊。

scdidadm(1M)

提供裝置 ID 配置的管理存取權。 

scgdevs(1M)

執行整體裝置名稱空間管理程序檔。 

scinstall(1M)

安裝與配置 Sun Cluster 軟體,可以互動或非互動方式執行。-p 選項可顯示 Sun Cluster 軟體的版次與套裝軟體版本資訊。

scrgadm(1M)

管理資源類型的註冊、資源群組的建立,以及資源群組內資源的啟動。-p 選項可顯示安裝的資源、資源群組以及資源類型的資訊。

scsetup(1M)

執行可產生 scconf 指令及其各類選項的互動式叢集配置裝置。

scshutdown(1M)

關閉整個叢集。 

scstat(1M)

提供叢集狀態的快照。 

scswitch(1M)

執行影響到資源群組與磁碟裝置群組的節點主檔與狀態的變更。 

另外,您也可以使用指令來管理 Sun Cluster 的容體管理者部份。這些指令由您的叢集中使用的特定容體管理者決定,可能是 Solstice DiskSuiteTM 或 VERITAS Volume Manager

1.3 準備管理叢集

本節說明如何開始準備管理叢集。

1.3.1 製作 Sun Cluster 硬體配置的文件

當您的 Sun Cluster 配置成長並有所變更時,製作與您網站特有的硬體層面相關的文件,可節省將來必須變更或升級原有叢集的管理時間。將連接各種不同叢集元件的電纜和連線做標記,也可使管理更為簡易。

保留您原始叢集配置及後續變更的記錄,也可幫助減少協力服務供應商為您的叢集提供服務時所花費的時間。

1.3.2 使用管理主控台

您可以選擇使用稱為管理主控台的專屬 SPARC 工作站,來管理作用中的叢集。通常,您是在管理主控台上安裝與執行「叢集控制面板」(CCP) 與圖形使用者介面 (GUI) 工具。有關 CCP 的詳細資訊,請進到閱 "1.4.1 如何從遠端登入 Sun Cluster"。有關如何安裝 Sun Management Center 和 SunPlex Manager GUI 工具的指示,請參閱 Sun Cluster 3.0 U1 安裝手冊

管理主控台不是叢集節點。管理主控台是用來以遠端方式存取叢集節點,透過公用網路或以網路為基礎的終端機集線器。

如果您的叢集是由 Sun EnterpriseTM 10000 伺服器所組成,您必須能夠從管理主控台登入「系統服務處理器」(SSP),並使用 netcon 指令來連接。netcon 連接 Sun Enterprise 10000 網域的預設方法是透過網路介面。如果網路無法存取,透過網路連接的叢集主控台 ( cconsole) 將會當掉不動。為避免此種情況發生,您可以使用"專用"模式中的 netcon,透過設定 -f 選項或在正常 netcon 階段作業下傳送 ~*。如此,在無法連接網路時,可提供您切換到串列控制介面的選項。請參閱 netcon(1M),以取得更詳細資訊。

Sun Cluster 不需要專用的管理主控台,但是使用專用主控台可以有以下優點:

1.3.3 備份叢集

定期備份您的叢集是很重要的。雖然 Sun Cluster 提供了一個在儲存裝置中含有備份資料的 HA 環境,但請勿以此取代定期備份的動作。Sun Cluster 可承受多重故障,但它無法保障因使用者、程式錯誤或災難性故障所造成的資料遺失。因此,您必須有備份程序來防止資料的遺失。

下列資訊必須納入作為備份作業的一部份。

1.4 開始管理叢集

表 1-2 是您管理叢集的起點。

表 1-2 Sun Cluster 3.0 管理工具

如果您要... 

則... 

詳細資訊,請進到... 

從遠端登入叢集 

使用 ccp 指令啟動「叢集控制面板」(CCP)。然後選取下列一種圖示: cconsolecrloginctelnet

"1.4.1 如何從遠端登入 Sun Cluster"

互動方式配置叢集 

啟動 scsetup 公用程式。

"1.4.2 如何存取 scsetup 公用程式"

顯示 Sun Cluster 版次號碼與版本資訊 

使用 scinstall 指令以及 使用具有 -p-pv 項的 scinstall 指令。

"1.4.3 如何顯示 Sun Cluster 版次與版本資訊"

顯示已安裝的資源、資源群組與資源類型 

使用 scrgadm -p 指令。

"1.4.4 如何顯示已配置的資源類型、資源群組與資源"

透過圖形介面監控叢集元件 

針對 Sun Management Center 使用 SunPlex Manager 或 Sun Cluster 模組。 

Sun Management Center 線上說明的 SunPlex Manager 或 Sun Cluster 模組

透過圖形介面管理某些叢集元件 

針對 Sun Management Center 使用 SunPlex Manager 或 Sun Cluster 模組。 

Sun Management Center 線上說明的 SunPlex Manager 或 Sun Cluster 模組 

檢查叢集元件的狀態 

使用 scstat 指令。

"1.4.5 如何檢查叢集元件的狀態"

檢視叢集配置 

使用 scconf -p 指令。

"1.4.6 如何檢視叢集配置"

檢查整體裝載點。 

使用 sccheck 指令。

"1.4.7 如何檢查整體裝載點"

查看 Sun Cluster 系統訊息 

檢查 /var/adm/messages 檔。

Solaris 系統管理文件 

監控 Solstice DiskSuite 的狀態 

使用 metastat 指令。

Solstice DiskSuite 文件 

監控 VERITAS Volume Manager 的狀態 

使用 vxstatvxva 指令。

VERITAS Volume Manager 文件 

1.4.1 如何從遠端登入 Sun Cluster

「叢集控制面板」(Cluster Control Panel,CCP)提供 cconsolecrlogin 以及 ctelnet 等工具的啟動台。這三種工具都會開啟連到一組指定節點的視窗。這個多重視窗連接是由每一個指定節點的主視窗以及一個共通視窗所組成。在共通視窗中直接輸入便可將指令傳到每一個主視窗,讓您能夠同時在所有叢集節點上執行指令。請參閱 ccp(1M)cconsole(1M) 線上援助頁,取得詳細資訊。

  1. 請在開始執行 CCP 之前,確認是否符合以下必備條件。

    • 在管理主控台上安裝適當的 Sun Cluster 軟體 (SUNWccon 套裝軟體)。

    • 確定管理主控台上的 PATH 變數包含 Sun Cluster 工具目錄,即 /opt/SUNWcluster/bin/usr/cluster/bin。您可藉由設定 $CLUSTER_HOME 環境變數來改變工具目錄位置。

    • 如果您使用終端機集線器的話,請配置 clusters 檔、serialports 檔及 nsswitch.conf 檔。這些可以是 /etc 檔案或 NIS/NIS+ 資料庫。請參閱 clusters(4)serialports(4),以取得詳細資訊。

  2. 判斷是否有 Sun Enterprise E10000 server 平台。

    • 如果不是,請前進至 步驟 3

    • 如果有,請使用 netcon 指令登入,並連接「系統服務處理器」(SSP)。連上後,請輸入 Shift~@ 來解除主控台鎖定並取得寫入權。

  3. 啟動 CCP 啟動台。

    請從管理主控台,輸入下列指令。


    # ccp clustername
    

    出現 CCP 啟動台。

  4. 要啟動叢集的遠端階段作業,請按一下 CCP 啟動台中的適當圖示 (cconsole、crlogin 或 ctelnet)。

1.4.1.1 範例

以下範例顯示「叢集控制面板」。

圖 1-1 叢集控制面板

Graphic

1.4.1.2 下一步

您也可以從指令行啟動 cconsolecrloginctelnet 階段作業。請參閱 cconsole(1M),以取得詳細資訊。

1.4.2 如何存取 scsetup 公用程式

scsetup(1M) 公用程式可以讓您以互動方式配置法定數目、資源群組、叢集傳輸、專用主機名稱、裝置群組,以及新增叢集的節點選項。

  1. 成為叢集中任何節點的超級使用者。

  2. 輸入 scsetup 公用程式。


    # scsetup
    

    顯示 Main Menu。

  3. 從功能表進行選擇,接著依螢幕上出現的指示進行。

    請參閱 scsetup 線上說明,以取得詳細資訊。

1.4.3 如何顯示 Sun Cluster 版次與版本資訊

您不必登入成為超級使用者便可以執行這些程序。

    顯示 Sun Cluster 修補程式號碼。

    Sun Cluster 更新版次是透過主產品修補程式號碼及更新版本來做確認,而 Sun Cluster 3.0 U1 的編號為 110648-05。


    % showrev -p
    

    以下範例顯示所有 Sun Cluster 套裝軟體的 Sun Cluster 版次號碼以及版本文字。


    % scinstall -pv
    

1.4.3.1 範例 - 顯示 Sun Cluster 版次號碼

下列範例顯示叢集的版次號碼。


% showrev -p | grep 110648
Patch:110648-05 Obsoletes:Requires:Incompatibles:Packages:

1.4.3.2 範例 - 顯示 Sun Cluster 版次與版本資訊

以下範例顯示叢集的版次資訊以及所有套裝軟體的版本資訊。


% scinstall -pv
SunCluster 3.0
SUNWscr:       3.0.0,REV=2000.10.01.01.00
SUNWscdev:     3.0.0,REV=2000.10.01.01.00
SUNWscu:       3.0.0,REV=2000.10.01.01.00
SUNWscman:     3.0.0,REV=2000.10.01.01.00
SUNWscsal:     3.0.0,REV=2000.10.01.01.00
SUNWscsam:     3.0.0,REV=2000.10.01.01.00
SUNWscvm:      3.0.0,REV=2000.10.01.01.00
SUNWmdm:       4.2.1,REV=2000.08.08.10.01

1.4.4 如何顯示已配置的資源類型、資源群組與資源

您也可使用 SunPlex Manager GUI 來完成此程序。請參閱 SunPlex Manager 線上說明,以取得詳細資訊。

您不必登入成超級使用者便可執行此程序。

    顯示叢集已配置的資源類型、資源群組與資源。


    % scrgadm -p
    

1.4.4.1 範例 - 顯示已配置的資源類型、資源群組與資源

以下範例顯示配置給叢集 schost 的資源類型 (RT Name)、資源群組 (RG Name) 與資源 (RS Name)。


% scrgadm -p
RT Name: SUNW.SharedAddress
  RT Description: HA Shared Address Resource Type 
RT Name: SUNW.LogicalHostname
  RT Description: Logical Hostname Resource Type 
RG Name: schost-sa-1 
  RG Description:  
    RS Name: schost-1
      RS Description: 
      RS Type: SUNW.SharedAddress
      RS Resource Group: schost-sa-1
RG Name: schost-lh-1 
  RG Description:  
    RS Name: schost-3
      RS Description: 
      RS Type: SUNW.LogicalHostname
      RS Resource Group: schost-lh-1

1.4.5 如何檢查叢集元件的狀態

您也可使用 SunPlex Manager GUI 來完成此程序。請參閱 SunPlex Manager 線上說明,以取得詳細資訊。

您不必登入成超級使用者便可執行此程序。

    檢查叢集元件的狀態。


    % scstat -p
    

1.4.5.1 範例 - 檢查叢集元件的狀態

以下範例顯示 scstat(1M) 傳回的叢集元件的狀態資訊。


% scstat -p
-- Cluster Nodes --
 
                    Node name           Status
                    ---------           ------
  Cluster node:     phys-schost-1      Online
  Cluster node:     phys-schost-2      Online
  Cluster node:     phys-schost-3      Online
  Cluster node:     phys-schost-4      Online
 
------------------------------------------------------------------
 
-- Cluster Transport Paths --
 
                    Endpoint            Endpoint            Status
                    --------            --------            ------
  Transport path:   phys-schost-1:qfe1 phys-schost-4:qfe1 Path online
  Transport path:   phys-schost-1:hme1 phys-schost-4:hme1 Path online
...
 
------------------------------------------------------------------
 
-- Quorum Summary --
 
  Quorum votes possible:      6
  Quorum votes needed:        4
  Quorum votes present:       6
 
-- Quorum Votes by Node --
 
                    Node Name           Present Possible Status
                    ---------           ------- -------- ------
  Node votes:       phys-schost-1      1        1       Online
  Node votes:       phys-schost-2      1        1       Online
...
 
-- Quorum Votes by Device --
 
                    Device Name         Present Possible Status 
                    -----------         ------- -------- ------ 
  Device votes:     /dev/did/rdsk/d2s2  1        1       Online 
  Device votes:     /dev/did/rdsk/d8s2  1        1       Online 
...
 
-- Device Group Servers --
 
                         Device Group        Primary             Secondary
                         ------------        -------             ---------
  Device group servers:  rmt/1               -                   -
  Device group servers:  rmt/2               -                   -
  Device group servers:  schost-1           phys-schost-2      phys-schost-1
  Device group servers:  schost-3           -                   -
 
-- Device Group Status --
 
                              Device Group        Status              
                              ------------        ------              
  Device group status:        rmt/1               Offline
  Device group status:        rmt/2               Offline
  Device group status:        schost-1           Online
  Device group status:        schost-3           Offline
 
------------------------------------------------------------------
 
-- Resource Groups and Resources --
 
            Group Name          Resources
            ----------          ---------
 Resources: test-rg             test_1
 Resources: real-property-rg    -
 Resources: failover-rg         -
 Resources: descript-rg-1       -
...
 
-- Resource Groups --
 
            Group Name          Node Name           State
            ----------          ---------           -----
     Group: test-rg             phys-schost-1      Offline
     Group: test-rg             phys-schost-2      Offline
...
 
-- Resources --
 
            Resource Name       Node Name           State     Status Message
            -------------       ---------           -----     --------------
  Resource: test_1              phys-schost-1      Offline   Offline
  Resource: test_1              phys-schost-2      Offline   Offline

1.4.6 如何檢視叢集配置

您也可使用 SunPlex Manager GUI 來完成此程序。請參閱 SunPlex Manager 線上說明,以取得詳細資訊。

您不必登入成超級使用者便可執行此程序。

    檢視叢集配置


    % scconf -p
    

1.4.6.1 範例 - 檢視叢集配置

下列範例列示叢集的配置。


% scconf -p
Cluster name:                       cluster-1
Cluster ID:                         0x3908EE1C
Cluster install mode:               disabled
Cluster private net:                172.16.0.0
Cluster private netmask:            255.255.0.0
Cluster new node authentication:    unix
Cluster new node list:              <NULL - Allow any node>
Cluster nodes:                      phys-schost-1 phys-schost-2 phys-schost-3
phys-schost-4
Cluster node name:                                 phys-schost-1
  Node ID:                                         1
  Node enabled:                                    yes
  Node private hostname:                           clusternode1-priv
  Node quorum vote count:                          1
  Node reservation key:                            0x3908EE1C00000001
  Node transport adapters:                         hme1 qfe1 qfe2
 
Node transport adapter:                          hme1
    Adapter enabled:                               yes
    Adapter transport type:                        dlpi
    Adapter property:                              device_name=hme
    Adapter property:                              device_instance=1
    Adapter property:                              dlpi_heartbeat_timeout=10000
...
Cluster transport junctions:                       hub0 hub1 hub2
 
Cluster transport junction:                        hub0
  Junction enabled:                                yes
  Junction type:                                   switch
  Junction port names:                             1 2 3 4
...
Junction port:                                   1
    Port enabled:                                  yes
 
Junction port:                                   2
    Port enabled:                                  yes
...
Cluster transport cables
                    Endpoint            Endpoint        State
                    --------            --------        -----
  Transport cable:  phys-schost-1:hme1@0 hub0@1        Enabled
  Transport cable:  phys-schost-1:qfe1@0 hub1@1        Enabled
  Transport cable:  phys-schost-1:qfe2@0 hub2@1        Enabled
  Transport cable:  phys-schost-2:hme1@0 hub0@2        Enabled
...
Quorum devices:                                    d2 d8
 
Quorum device name:                                d2
  Quorum device votes:                             1
  Quorum device enabled:                           yes
  Quorum device name:                              /dev/did/rdsk/d2s2
  Quorum device hosts (enabled):                   phys-schost-1
 phys-schost-2
  Quorum device hosts (disabled): 
...
Device group name:                                 schost-3
  Device group type:                               SDS
  Device group failback enabled:                   no
  Device group node list:                          phys-schost-3, phys-schost-4
  Diskset name:                                    schost-3

1.4.7 如何檢查整體裝載點

sccheck(1M) 指令可透過叢集檔案系統及其整體裝載點來檢查 /etc/vfstab 檔有無配置錯誤。 sccheck 指令只傳回錯誤. 如果未發現錯誤,sccheck 只會回到 Shell 提示符號。


註解 -

請在進行影響裝置或容體管理元件的叢集配置變更之後,執行 sccheck


  1. 成為叢集中任何節點的超級使用者。

  2. 確認叢集配置。


    # sccheck
    

1.4.7.1 範例 - 確認叢集配置

下列範例顯示節點 phys-schost-3 遺失了裝載點 /global/schost-1


# sccheck
vfstab-check:WARNING - phys-schost-3 - Missing mount point /global/schost-1