本章包含有關 Sun Cluster 最常見問題的解答。問題是依照主題來排列。
倒底什麼是高可用性系統?
Sun Cluster 將高可用性 (HA) 定義為,即使發生一般會造成伺服器系統無法使用的故障,叢集仍可保持應用程式啟動並執行的能力。
叢集是利用何種處理程序來提供高可用性?
藉由失效保護的處理程序,叢集組織架構提供高可用性的環境。失效保護是叢集執行的一系列步驟,可將應用程式從失效節點移轉至叢集中的另一個可作業節點上。
介於 HA 與可延伸的服務之間的差異是?
HA 服務表示應用程式一次僅在叢集中的一個主要節點上執行。 其它的節點可能執行其它的應用程式,但是每個應用程式僅執行於單一節點上。 如果主要節點失效,於失效節點上執行的應用程式會移轉至另一個節點繼續執行。
可延伸服務將應用程式分散在多個節點,以建立單一、邏輯的服務。可延伸服務會利用其執行所在的整個叢集中的節點與處理器數目。一個節點接收所有應用程式的要求,並將其分送到正在其上執行應用程式伺服器的節點。如果此節點失效 (稱為「整體介面節點」或 GIF),整體介面會移轉至存活的節點上。 如果應用程式所執行的任一節點失效,應用程式會繼續在其它的節點上執行,其中部份效能會降低,直到失效節點返回叢集之後才改善。
用戶端是否可以執行含其它節點的一或多項叢集高可用性的 NFS 伺服器?
不行。能夠除去並重新啟動 lockd(在 NFS 失效回復時會發生)的本端鎖定介面出現問題。而在除去和重新啟動期間,暫停執行的本端處理將被授予此項鎖定,此項鎖定可使擁有此項鎖定的從屬站系統免於在失效回復後加以收回。
是否可以使用不在 Resource Group Manager 控制下的應用程式的叢集檔案系統?
可以。然而,沒有 RGM 的控制,應用程式無法在其執行的節點失效時存活。
是否所有的叢集檔案系統均必須具有一個位於 /global/device-group 目錄中的裝載點?
不是。然而,將叢集檔案系統放在相同的裝載點之下 (如 /global/device-group),會使這些檔案系統的組織和管理改善。
介於使用叢集檔案系統和匯出 NFS 檔案系統之間的差異是什麼?
有許多不同:
叢集檔案系統支援整體裝置。NFS 不支援遠端存取裝置。
叢集檔案系統擁有整體名稱空間。只需要一個裝設指令。至於 NFS,您必須在每一個節點裝設檔案系統。
叢集檔案系統快取檔案的機會多於 NFS。例如,當某個檔案正在被多個節點存取進行讀取、寫入、檔案鎖定和非同步輸入/輸出。
如果有一個伺服器失敗,叢集檔案系統會支援緊密的失效保護。NFS 支援多重伺服器,但是失效保護只能針對唯讀檔案系統。
建置叢集檔案系統,是為了利用提供遠程 DMA 和零複製功能的未來快速叢集交互連接。
如果您變更叢集檔案系統中某個檔案的屬性 (例如,使用 chmod(1M)),此變更會立即反映到所有節點。 對於匯出式 NFS 檔案系統,此動作要花費較長時間。
是否需要鏡映所有的磁碟裝置?
對於要作為高可用性的磁碟裝置,必須要進行鏡映,或使用 RAID-5 硬體。所有的數據服務應該使用高可用性磁碟裝置,或裝設於高可用性磁碟裝置上的叢集檔案系統。這樣的配置可以容忍單一磁碟失效。
可用的 Sun Cluster 數據服務是什麼呢?
支援的數據服務清單包含於 Sun Cluster 3.0 版次注意事項。
Sun Cluster 數據服務所支援的應用程式版本為?
支援的應用程式版本清單包含於 Sun Cluster 3.0 版次注意事項。
我是否可寫入自己的數據服務?
可以。請參閱 Sun Cluster 3.0 Data Services Developers' Guide 及 Data Service Development Library API 所提供的「Data Service Enabling Technologies」文件,以取得其他資訊。
在建立網路資源時,我是否該指定數字型的 IP 位址或主機名稱?
指定網路資源,最好是使用 UNIX 主機名稱,而非數字型 IP 位址。
在建立網路資源時,使用邏輯主機名稱(LogicalHostname 資源)或共用的位址(SharedAddress 資源)之間的差異是什麼?
當文件提到在 Failover 模式資源群組中使用 LogicalHostname 資源 時,可能會交替使用 SharedAddress 資源或 LogicalHostname 資源。使用 SharedAddress 資源 會需要一些額外的負擔,因為叢集網路軟體式是針對 SharedAddress 來配置,而不是 LogicalHostname。
使用 SharedAddress 的優點,是當您同時配置可延伸和失效保護數據服務,而且要用戶端能夠使用相同的主機名稱來存取這兩種服務。在此情形下,SharedAddress 資源以及失效保護應用程式資源是包含於 一個資源群組中,而可延伸服務資源是包含於另外的資源群組,並且配置使用 SharedAddress。於是可延伸和失效保護服務均可使用 SharedAddress 資源中配置的同一組主機名稱/位址。
Sun Cluster 所支援的公用網路配接卡為何?
目前,Sun Cluster 支援 Ethernet (10/100BASE-T 和 1000BASE-SX Gb ) 公用網路配接卡。 因為未來可能會支援新的介面,請洽詢您的 Sun 業務代表,以取得最新的資訊。
在失效保護中 MAC 位址扮演的角色是什麼?
發生失效保護時,會產生新的「位址解析度通信協定 (ARP)」封包並廣播到網路上。 這些 ARP 封包包含新的 MAC 位址 (節點移轉後的新實體配接卡的位址) 和舊的 IP 位址。 當網路上的另一部機器收到這些封包時,會清除其 ARP 快取記憶體中的舊 MAC-IP 對應,並使用新的資訊。
Sun Cluster 是否支援在主機配接卡的 OpenBoot PROM 中設定 local-mac-address?=true
不是。不支援此變數。
所有的叢集成員是否需要相同的 root 密碼?
每個叢集成員不需要有相同的 root 密碼。然而,所有的節點使用相同的 root 密碼可以簡化您的節點管理工作。
節點啟動的順序是否相當重要?
在大部份的情況下並不會有影響。然而,啟動順序對防止 amnesia 是很重要的 (請參照 "法定人和法定裝置" 以取得有關 amnesia 的詳細資訊)。例如,如果節點 2 是 quorum 裝置的所有者,而且節點 1 關機,接著您又將節點 2 關機,則您必須先啟動節點 2 再啟動節點 1。 這樣可以防止您意外啟動具有過時叢集配置資訊的節點。
我是否需要在叢集節點中鏡映本端磁碟?
可以。雖然這種鏡映並非必要,但鏡映叢集節點的磁碟可以排除非鏡映磁碟失效而導致節點當機的情況。 鏡映叢集節點的區域磁碟的缺點,是需要較多的系統管理負擔。
叢集成員備份的問題有哪些?
您可以對叢集使用多種備份方法。其中一種方法是令某個節點連接磁帶機/磁帶庫作為備份節點。 然後使用叢集檔案系統來備份資料。不要連接此節點至共用磁碟。
請參閱 Sun Cluster 3.0 系統管理手冊 以取得有關備份和復原程序的其餘資訊。
什麼原因讓多主機儲存體具備高可用性?
多主機儲存體具備高可用性,是因為有了鏡映 (或硬體式的 RAID-5 控制器) 而可以承受單一磁碟的遺失。 因為多主機儲存裝置具有一個以上的主機連接,也可以承受失去它所連接的單一節點。
支援哪些多主機儲存體配置?
目前,不支援大於兩節點的連接。單一機殼內的所有多主機磁碟必須連接至相同的兩個節點。 請參照 "Sun Cluster 拓樸" 以取得其他資訊。
我可以使用對 SCSI-3 PGR 配置的磁碟作為整體裝置嗎?
目前,Sun Cluster 中不支援 SCSI-3 PGR。只有支援 Only SCSI-2 規格可作為整體磁碟裝置。 因為不支援 SCSI-3 磁碟,您必須對要作為叢集之整體裝置的 SCSI-3 磁碟使用 scdidadm(1M) 的 -R 選項來設定正確的 SCSI 規格。
Sun Cluster 支援哪些叢集交互連接?
目前 Sun Cluster 支援 (100BASE-T Fast Ethernet 和 1000BASE-SX Gb) 叢集交互連接。 亦計劃支援 Scalable Coherent Interface (SCI)。
使用叢集需要考慮任何特殊的用戶端需求或限制嗎?
用戶端系統連接至叢集,與連接至任何其他伺服器相同。在某些情況下,視數據服務應用程式而定,您可能需要安裝用戶端軟體或執行其它配置變更,使得用戶端可以連接至數據服務應用程式。請參閱 Sun Cluster 3.0 Data Services Installation and Configuration Guide 中的個別章節,以取得有關用戶-端配置需求的其他資訊。
Sun Cluster 需要管理主控台嗎?
是的。
管理主控台必須專屬於叢集,或者可以用於其它作業?
Sun Cluster 不需要專用的管理主控台,但是使用專用主控台可以有以下優點:
在同一機器上將主控台和管理工具分組,達到中央化叢集管理
讓您的硬體服務供應商可較快速地解決問題
管理主控台位置必須 "靠近" 叢集本身,例如在同一房間中?
請洽詢您的硬體服務供應商。供應商可能會要求主控台位置要靠近叢集本身。將主控台置於同一房間中,並無技術上的原因。
一部管理主控台在符合距離要求的前提下,可以服務一個以上的叢集嗎?
可以。您可以從單一管理主控台來控制多個叢集。您也可以在叢集之間共用單一的終端機集線器。
Sun Cluster 需要終端機集線器嗎?
執行 Sun Cluster 3.0 不需要終端機集線器。Sun Cluster 2.2 產品需要終端機集線器作為失效隔離之用,Sun Cluster 3.0 並不依靠終端機集線器。
我發現到多數的 Sun Cluster 伺服器需要終端集線器,但是 E10000 則不用。這是什麼原因呢?
終端機集線器對大部份的伺服器而言,實際上是一個串列對 Ethernet 轉換器。 其主控台是串列埠。Sun Enterprise E10000 server 沒有串列主控台。「系統服務處理器 (SSP)」是主控台,是透過 Ethernet 或 jtag 埠。對於 Sun Enterprise E10000 server,您一定要使用 SSP 於主控台。
使用終端集線器有些什麼樣的益處?
使用終端機集線器可以提供,從網路上任何位置的遠端工作站以主控台層次來存取每一個節點,包括節點是在 OpenBoot PROM (OBP) 時。
如果我使用的並非 Sun 所支援的終端機集線器時,我該知道些什麼才能讓我想用的合乎標準呢?
Sun 支援的終端機集線器與其它主控台裝置的主要差異,是 Sun 終端機集線器具有特殊的韌體可以防止終端機集線器在開機時送出中斷。請注意,如果您的主控台裝置會送出中斷,或可能會被解釋為中斷的信號,它將會關閉節點。
我是否可以釋放在 SUN 所支援的終端機集線器上已鎖定的連接埠,而不需重新加以啟動?
可以。請記下需要重設的埠號,並執行下列項目:
telnet tc Enter Annex port name or number: cli annex: su - annex# admin admin : reset port_number admin : quit annex# hangup # |
請參照 Sun Cluster 3.0 系統管理手冊 以取得配置和管理 Sun 支援之終端機集線器的其他資訊。
如果終端機集線器本身失效怎麼辦?我需要有一個備用嗎?
不需要。如果終端機集線器失效,您並不會失去任何叢集可用性。但是您會失去連接節點主控台的能力,直到集線器回復服務為止。
如果我真的使用終端機集線器,其安全性如何?
一般而言,終端機集線器是連接至系統管理者所使用的小型網路,不是連接到其它用戶端存取的網路。 您可以藉由限制該特定網路的存取權來控制安全性。