本章提供如何準備管理叢集以及使用 Sun Cluster 管理工具的程序相關資訊。
以下是本章介紹的程序列表。
Sun Cluster 為高度可用的環境,可確保一般使用者隨時可以使用重要的應用程式。系統管理員的工作是保證 Sun Cluster 穩定運轉。
在著手管理工作之前,您應該熟悉 Sun Cluster 3.0 U1 安裝手冊 中的規劃資訊以及 Sun Cluster 3.0 U1 概念 文件中的詞彙。Sun Cluster 管理共分成數項作業,並在下列手冊分別敘述:
定期或每天執行的管理以及維護叢集的標準作業。本手冊將說明這些作業。
資料服務作業,例如安裝、配置以及變更屬性。這些作業在 Sun Cluster 3.0 U1 Data Services Installation and Configuration Guide 中敘述。
服務作業,包括新增或修復儲存體或網路硬體。這些作業在 Sun Cluster 3.0 U1 Hardware Guide 中敘述。
在大部份情況下,您可以一面執行 Sun Cluster 管理作業,而叢集同時保持運轉且影響只限定於一個節點。對於需要關閉整個叢集才能執行的程序,請將關機時間排定下班後,以使對系統造成的影響降至最小。如果您計劃關閉叢集或叢集節點,請先通知使用者。
您可以在 Sun Cluster 中使用圖形使用者介面 (Graphical User Interface,GUI) 或指令行來執行管理作業。本節提供這些工具的概觀。
Sun Cluster 支援兩種圖形使用者介面 (GUI),讓您能夠在叢集上執行不同管理作業。這些 GUI 工具分別為 SunPlex Manager 及 Sun Management Center。請參閱 第 9章, 利用圖形使用者介面管理 Sun Cluster。,以取得有關 SunPlex Manager 和 Sun Management Center 的詳細資訊及其配置程序的說明。關於如何使用這些工具的具體說明,請參閱各個 GUI 的線上說明。
您可以透過 scsetup(1M) 公用程式以互動方式執行大部份的 Sun Cluster 管理作業。只要適當,本手冊中的管理程序都是使用 scsetup 來敘述。
您以可透過 scsetup 公用程式來管理以下項目:
法定數目
資源群組
叢集交互連接
裝置群組和容體
專用主機名稱
新的節點
其他叢集屬性
以下列出您用來管理 Sun Cluster 的其他指令。請參閱線上援助頁,以取得詳細資訊。
表 1-1 Sun Cluster 指令行介面指令
指令 |
說明 |
---|---|
ccp(1M) |
啟動叢集的遠端主控台存取 |
pmfadm(1M) |
提供處理監控設備的管理存取權。 |
pnmset(1M) |
配置公用網路管理 (PNM)。 |
pnmstat(1M) |
報告由 PNM 監視的「網路卡故障轉移」(NAFO) 群組的狀態。 |
sccheck(1M) |
檢查並驗證 /etc/vfstab 檔中的整體裝載項目。 |
scconf(1M) |
更新 Sun Cluster 配置。-p 選項可列出叢集配置資訊。 |
scdidadm(1M) |
提供裝置 ID 配置的管理存取權。 |
scgdevs(1M) |
執行整體裝置名稱空間管理程序檔。 |
scinstall(1M) |
安裝與配置 Sun Cluster 軟體,可以互動或非互動方式執行。-p 選項可顯示 Sun Cluster 軟體的版次與套裝軟體版本資訊。 |
scrgadm(1M) |
管理資源類型的註冊、資源群組的建立,以及資源群組內資源的啟動。-p 選項可顯示安裝的資源、資源群組以及資源類型的資訊。 |
scsetup(1M) |
執行可產生 scconf 指令及其各類選項的互動式叢集配置裝置。 |
scshutdown(1M) |
關閉整個叢集。 |
scstat(1M) |
提供叢集狀態的快照。 |
scswitch(1M) |
執行影響到資源群組與磁碟裝置群組的節點主檔與狀態的變更。 |
另外,您也可以使用指令來管理 Sun Cluster 的容體管理者部份。這些指令由您的叢集中使用的特定容體管理者決定,可能是 Solstice DiskSuiteTM 或 VERITAS Volume Manager
本節說明如何開始準備管理叢集。
當您的 Sun Cluster 配置成長並有所變更時,製作與您網站特有的硬體層面相關的文件,可節省將來必須變更或升級原有叢集的管理時間。將連接各種不同叢集元件的電纜和連線做標記,也可使管理更為簡易。
保留您原始叢集配置及後續變更的記錄,也可幫助減少協力服務供應商為您的叢集提供服務時所花費的時間。
您可以選擇使用稱為管理主控台的專屬 SPARC 工作站,來管理作用中的叢集。通常,您是在管理主控台上安裝與執行「叢集控制面板」(CCP) 與圖形使用者介面 (GUI) 工具。有關 CCP 的詳細資訊,請進到閱 "1.4.1 如何從遠端登入 Sun Cluster"。有關如何安裝 Sun Management Center 和 SunPlex Manager GUI 工具的指示,請參閱 Sun Cluster 3.0 U1 安裝手冊。
管理主控台不是叢集節點。管理主控台是用來以遠端方式存取叢集節點,透過公用網路或以網路為基礎的終端機集線器。
如果您的叢集是由 Sun EnterpriseTM 10000 伺服器所組成,您必須能夠從管理主控台登入「系統服務處理器」(SSP),並使用 netcon 指令來連接。netcon 連接 Sun Enterprise 10000 網域的預設方法是透過網路介面。如果網路無法存取,透過網路連接的叢集主控台 ( cconsole) 將會當掉不動。為避免此種情況發生,您可以使用"專用"模式中的 netcon,透過設定 -f 選項或在正常 netcon 階段作業下傳送 ~*。如此,在無法連接網路時,可提供您切換到串列控制介面的選項。請參閱 netcon(1M),以取得更詳細資訊。
Sun Cluster 不需要專用的管理主控台,但是使用專用主控台可以有以下優點:
在同一機器上將主控台和管理工具分組,達到中央化叢集管理
透過 Enterprise Services 或服務供應商提供更快速的問題解決方案。
定期備份您的叢集是很重要的。雖然 Sun Cluster 提供了一個在儲存裝置中含有備份資料的 HA 環境,但請勿以此取代定期備份的動作。Sun Cluster 可承受多重故障,但它無法保障因使用者、程式錯誤或災難性故障所造成的資料遺失。因此,您必須有備份程序來防止資料的遺失。
下列資訊必須納入作為備份作業的一部份。
所有的檔案系統分割區
所有資料庫資料,如果您執行 DBMS 資料服務。
所有叢集磁碟的磁碟分割區資訊
md.tab 檔,如果您使用 Solstice DiskSuite 當作容體管理者的話。
表 1-2 是您管理叢集的起點。
表 1-2 Sun Cluster 3.0 管理工具
如果您要... |
則... |
詳細資訊,請進到... |
---|---|---|
從遠端登入叢集 |
使用 ccp 指令啟動「叢集控制面板」(CCP)。然後選取下列一種圖示: cconsole、crlogin 或 ctelnet。 | |
互動方式配置叢集 |
啟動 scsetup 公用程式。 | |
顯示 Sun Cluster 版次號碼與版本資訊 |
使用 scinstall 指令以及 使用具有 -p 或 -pv 項的 scinstall 指令。 | |
顯示已安裝的資源、資源群組與資源類型 |
使用 scrgadm -p 指令。 | |
透過圖形介面監控叢集元件 |
針對 Sun Management Center 使用 SunPlex Manager 或 Sun Cluster 模組。 |
Sun Management Center 線上說明的 SunPlex Manager 或 Sun Cluster 模組 |
透過圖形介面管理某些叢集元件 |
針對 Sun Management Center 使用 SunPlex Manager 或 Sun Cluster 模組。 |
Sun Management Center 線上說明的 SunPlex Manager 或 Sun Cluster 模組 |
檢查叢集元件的狀態 |
使用 scstat 指令。 | |
檢視叢集配置 |
使用 scconf -p 指令。 | |
檢查整體裝載點。 |
使用 sccheck 指令。 | |
查看 Sun Cluster 系統訊息 |
檢查 /var/adm/messages 檔。 |
Solaris 系統管理文件 |
監控 Solstice DiskSuite 的狀態 |
使用 metastat 指令。 |
Solstice DiskSuite 文件 |
監控 VERITAS Volume Manager 的狀態 |
使用 vxstat 或 vxva 指令。 |
VERITAS Volume Manager 文件 |
「叢集控制面板」(Cluster Control Panel,CCP)提供 cconsole、crlogin 以及 ctelnet 等工具的啟動台。這三種工具都會開啟連到一組指定節點的視窗。這個多重視窗連接是由每一個指定節點的主視窗以及一個共通視窗所組成。在共通視窗中直接輸入便可將指令傳到每一個主視窗,讓您能夠同時在所有叢集節點上執行指令。請參閱 ccp(1M) 及 cconsole(1M) 線上援助頁,取得詳細資訊。
請在開始執行 CCP 之前,確認是否符合以下必備條件。
在管理主控台上安裝適當的 Sun Cluster 軟體 (SUNWccon 套裝軟體)。
確定管理主控台上的 PATH 變數包含 Sun Cluster 工具目錄,即 /opt/SUNWcluster/bin 及 /usr/cluster/bin。您可藉由設定 $CLUSTER_HOME 環境變數來改變工具目錄位置。
如果您使用終端機集線器的話,請配置 clusters 檔、serialports 檔及 nsswitch.conf 檔。這些可以是 /etc 檔案或 NIS/NIS+ 資料庫。請參閱 clusters(4) 和 serialports(4),以取得詳細資訊。
判斷是否有 Sun Enterprise E10000 server 平台。
如果不是,請前進至 步驟 3。
如果有,請使用 netcon 指令登入,並連接「系統服務處理器」(SSP)。連上後,請輸入 Shift~@ 來解除主控台鎖定並取得寫入權。
啟動 CCP 啟動台。
請從管理主控台,輸入下列指令。
# ccp clustername |
出現 CCP 啟動台。
要啟動叢集的遠端階段作業,請按一下 CCP 啟動台中的適當圖示 (cconsole、crlogin 或 ctelnet)。
以下範例顯示「叢集控制面板」。
您也可以從指令行啟動 cconsole、crlogin 或 ctelnet 階段作業。請參閱 cconsole(1M),以取得詳細資訊。
scsetup(1M) 公用程式可以讓您以互動方式配置法定數目、資源群組、叢集傳輸、專用主機名稱、裝置群組,以及新增叢集的節點選項。
成為叢集中任何節點的超級使用者。
輸入 scsetup 公用程式。
# scsetup |
顯示 Main Menu。
從功能表進行選擇,接著依螢幕上出現的指示進行。
請參閱 scsetup 線上說明,以取得詳細資訊。
您不必登入成為超級使用者便可以執行這些程序。
顯示 Sun Cluster 修補程式號碼。
Sun Cluster 更新版次是透過主產品修補程式號碼及更新版本來做確認,而 Sun Cluster 3.0 U1 的編號為 110648-05。
% showrev -p |
以下範例顯示所有 Sun Cluster 套裝軟體的 Sun Cluster 版次號碼以及版本文字。
% scinstall -pv |
下列範例顯示叢集的版次號碼。
% showrev -p | grep 110648 Patch:110648-05 Obsoletes:Requires:Incompatibles:Packages: |
以下範例顯示叢集的版次資訊以及所有套裝軟體的版本資訊。
% scinstall -pv SunCluster 3.0 SUNWscr: 3.0.0,REV=2000.10.01.01.00 SUNWscdev: 3.0.0,REV=2000.10.01.01.00 SUNWscu: 3.0.0,REV=2000.10.01.01.00 SUNWscman: 3.0.0,REV=2000.10.01.01.00 SUNWscsal: 3.0.0,REV=2000.10.01.01.00 SUNWscsam: 3.0.0,REV=2000.10.01.01.00 SUNWscvm: 3.0.0,REV=2000.10.01.01.00 SUNWmdm: 4.2.1,REV=2000.08.08.10.01 |
您也可使用 SunPlex Manager GUI 來完成此程序。請參閱 SunPlex Manager 線上說明,以取得詳細資訊。
您不必登入成超級使用者便可執行此程序。
顯示叢集已配置的資源類型、資源群組與資源。
% scrgadm -p |
以下範例顯示配置給叢集 schost 的資源類型 (RT Name)、資源群組 (RG Name) 與資源 (RS Name)。
% scrgadm -p RT Name: SUNW.SharedAddress RT Description: HA Shared Address Resource Type RT Name: SUNW.LogicalHostname RT Description: Logical Hostname Resource Type RG Name: schost-sa-1 RG Description: RS Name: schost-1 RS Description: RS Type: SUNW.SharedAddress RS Resource Group: schost-sa-1 RG Name: schost-lh-1 RG Description: RS Name: schost-3 RS Description: RS Type: SUNW.LogicalHostname RS Resource Group: schost-lh-1 |
您也可使用 SunPlex Manager GUI 來完成此程序。請參閱 SunPlex Manager 線上說明,以取得詳細資訊。
您不必登入成超級使用者便可執行此程序。
檢查叢集元件的狀態。
% scstat -p |
以下範例顯示 scstat(1M) 傳回的叢集元件的狀態資訊。
% scstat -p -- Cluster Nodes -- Node name Status --------- ------ Cluster node: phys-schost-1 Online Cluster node: phys-schost-2 Online Cluster node: phys-schost-3 Online Cluster node: phys-schost-4 Online ------------------------------------------------------------------ -- Cluster Transport Paths -- Endpoint Endpoint Status -------- -------- ------ Transport path: phys-schost-1:qfe1 phys-schost-4:qfe1 Path online Transport path: phys-schost-1:hme1 phys-schost-4:hme1 Path online ... ------------------------------------------------------------------ -- Quorum Summary -- Quorum votes possible: 6 Quorum votes needed: 4 Quorum votes present: 6 -- Quorum Votes by Node -- Node Name Present Possible Status --------- ------- -------- ------ Node votes: phys-schost-1 1 1 Online Node votes: phys-schost-2 1 1 Online ... -- Quorum Votes by Device -- Device Name Present Possible Status ----------- ------- -------- ------ Device votes: /dev/did/rdsk/d2s2 1 1 Online Device votes: /dev/did/rdsk/d8s2 1 1 Online ... -- Device Group Servers -- Device Group Primary Secondary ------------ ------- --------- Device group servers: rmt/1 - - Device group servers: rmt/2 - - Device group servers: schost-1 phys-schost-2 phys-schost-1 Device group servers: schost-3 - - -- Device Group Status -- Device Group Status ------------ ------ Device group status: rmt/1 Offline Device group status: rmt/2 Offline Device group status: schost-1 Online Device group status: schost-3 Offline ------------------------------------------------------------------ -- Resource Groups and Resources -- Group Name Resources ---------- --------- Resources: test-rg test_1 Resources: real-property-rg - Resources: failover-rg - Resources: descript-rg-1 - ... -- Resource Groups -- Group Name Node Name State ---------- --------- ----- Group: test-rg phys-schost-1 Offline Group: test-rg phys-schost-2 Offline ... -- Resources -- Resource Name Node Name State Status Message ------------- --------- ----- -------------- Resource: test_1 phys-schost-1 Offline Offline Resource: test_1 phys-schost-2 Offline Offline |
您也可使用 SunPlex Manager GUI 來完成此程序。請參閱 SunPlex Manager 線上說明,以取得詳細資訊。
您不必登入成超級使用者便可執行此程序。
檢視叢集配置
% scconf -p |
下列範例列示叢集的配置。
% scconf -p Cluster name: cluster-1 Cluster ID: 0x3908EE1C Cluster install mode: disabled Cluster private net: 172.16.0.0 Cluster private netmask: 255.255.0.0 Cluster new node authentication: unix Cluster new node list: <NULL - Allow any node> Cluster nodes: phys-schost-1 phys-schost-2 phys-schost-3 phys-schost-4 Cluster node name: phys-schost-1 Node ID: 1 Node enabled: yes Node private hostname: clusternode1-priv Node quorum vote count: 1 Node reservation key: 0x3908EE1C00000001 Node transport adapters: hme1 qfe1 qfe2 Node transport adapter: hme1 Adapter enabled: yes Adapter transport type: dlpi Adapter property: device_name=hme Adapter property: device_instance=1 Adapter property: dlpi_heartbeat_timeout=10000 ... Cluster transport junctions: hub0 hub1 hub2 Cluster transport junction: hub0 Junction enabled: yes Junction type: switch Junction port names: 1 2 3 4 ... Junction port: 1 Port enabled: yes Junction port: 2 Port enabled: yes ... Cluster transport cables Endpoint Endpoint State -------- -------- ----- Transport cable: phys-schost-1:hme1@0 hub0@1 Enabled Transport cable: phys-schost-1:qfe1@0 hub1@1 Enabled Transport cable: phys-schost-1:qfe2@0 hub2@1 Enabled Transport cable: phys-schost-2:hme1@0 hub0@2 Enabled ... Quorum devices: d2 d8 Quorum device name: d2 Quorum device votes: 1 Quorum device enabled: yes Quorum device name: /dev/did/rdsk/d2s2 Quorum device hosts (enabled): phys-schost-1 phys-schost-2 Quorum device hosts (disabled): ... Device group name: schost-3 Device group type: SDS Device group failback enabled: no Device group node list: phys-schost-3, phys-schost-4 Diskset name: schost-3 |
sccheck(1M) 指令可透過叢集檔案系統及其整體裝載點來檢查 /etc/vfstab 檔有無配置錯誤。 sccheck 指令只傳回錯誤. 如果未發現錯誤,sccheck 只會回到 Shell 提示符號。
請在進行影響裝置或容體管理元件的叢集配置變更之後,執行 sccheck。
下列範例顯示節點 phys-schost-3 遺失了裝載點 /global/schost-1。
# sccheck vfstab-check:WARNING - phys-schost-3 - Missing mount point /global/schost-1 |