本章包含有關 SunPlex 系統最常見問題的解答。 問題是依照主題來排列。
到底什麼是高可用性系統?
SunPlex 系統將高可用性 (HA) 定義為,即使發生一般會造成伺服器系統無法使用的故障,叢集仍可保持應用程式可啟動和執行的能力。
叢集是利用何種處理程序來提供高可用性?
藉由故障轉移的處理程序,叢集框架提供高可用性的環境。 故障轉移是叢集所執行的一系列步驟,可將應用程式從故障節點移轉至叢集中的另一個可作業節點上。
故障轉移與可延伸的資料服務之間的差異為何?
高可用性的資料服務有兩類,亦即故障轉移和可延伸。
故障轉移資料服務表示應用程式一次僅在叢集中的一個主要節點上執行。 其它的節點可能執行其它的應用程式,但是每個應用程式僅執行於單一節點上。 如果主要節點故障,在故障節點上執行的應用程式會移轉至另一個節點繼續執行。
可延伸服務將應用程式分散在多個節點,以建立單一、邏輯的服務。 可延伸服務會利用其執行所在的整個叢集中的節點與處理器數目。
對於各個應用程式,一個節點擁有叢集的實體介面。 此節點稱為「整體介面節點」(Global Interface Node,GIN)。 叢集中可有多重的 GIN。 每一 GIN 皆擁有一或多個可供可延伸服務使用的邏輯介面。 這些邏輯介面稱為整體介面。 一個 GIN 擁有對於特定應用式伺服器正在執行的多重節點上。 假如 GIN 故障,則整體介面發生故障轉移而移轉至存活節點上。
如果應用程式所執行的任一節點故障,應用程式會繼續在其它的節點上執行,其中部份效能會降低,直到故障節點返回叢集之後才改善。
用戶端是否可以執行含其它節點的一或多項叢集高可用性的 NFS 伺服器?
不,不要做回送裝載。
是否可以為不在 Resource Group Manager 控制下的應用程式使用叢集檔案系統?
可以。 然而,沒有 RGM 的控制,應用程式需要在其執行的節點故障時以手動方式重新啟動。
是否所有的叢集檔案系統均必須具有一個位於 /global 下的裝載點?
不是。然而,將叢集檔案系統放在相同的裝載點之下 (如 /global/),會使這些檔案系統的組織和管理有所改善。
使用叢集檔案系統和匯出 NFS 檔案系統之間的差異是什麼?
有多處的差異:
叢集檔案系統支援整體裝置。 NFS 不支援遠端存取裝置。
叢集檔案系統擁有全域名稱空間。 只需要一個裝載指令。 至於 NFS,您必須在每一個節點載設檔案系統。
叢集檔案系統快取檔案的機會多於 NFS。 例如,當某個檔案正在被多個節點存取進行讀取、寫入、檔案鎖定和非同步輸入/輸出。
如果有一個伺服器失敗,叢集檔案系統會支援緊密的故障轉移。 NFS 支援多重伺服器,但是故障轉移只能針對唯讀檔案系統。
建置叢集檔案系統,是為了利用提供遠程 DMA 和零複製功能的未來快速叢集交互連接。
如果您變更叢集檔案系統中某個檔案的屬性 (例如,使用 chmod(1M)),此變更會立即反映到所有節點。 對於匯出式 NFS 檔案系統,此動作要花費較長時間。
檔案系統 /global/.devices/<node>@<node ID> 出現在我的叢集節點上。我可使用此檔案系統,以儲存我想要讓其成為高可用及整體的資料嗎?
這些檔案系統會儲存整體裝置的名稱空間。 它們不供一般使用。 當它們為整體時,從不以整體方式存取,每一節點只存取自己的整體裝置的名稱空間。 假如節點當機了,其它節點就無法存取當機節點的名稱空間。 這些檔案系統不具高可用性。 它們不應用來儲存需為整體或高可用的資料
是否需要鏡像所有的磁碟裝置?
對於要作為高可用性的磁碟裝置,必須要進行鏡像,或使用 RAID-5 硬體。 所有的資料服務應該使用高可用性磁碟裝置,或裝載於高可用性磁碟裝置上的叢集檔案系統。 這樣的配置可以容忍單一磁碟故障。
我可對本機磁碟 (開機磁碟) 使用一個容體管理者,而對多重主機磁碟使用不同的容體管理者嗎?
此配置乃由管理本機磁碟的 Solstice DiskSuite 軟體與管理多重主機磁碟的 VERITAS Volume Manager 所支援。但並不支援其它組合。
可用的 SunPlex 資料服務是什麼?
支援的資料服務清單包含於 Sun Cluster 3.0 12/01 版次注意事項。
SunPlex 資料服務所支援的應用程式版本為何?
支援的應用程式版本包含於 Sun Cluster 3.0 12/01 版次注意事項。
我是否可寫入自己的資料服務?
可以。 請參閱 Sun Cluster 3.0 12/01 Data Services Developer's Guide 及 Data Service Development Library API 所提供的「Data Service Enabling Technologies」文件,以取得詳細資訊。
在建立網路資源時,我是否該指定數字型的 IP 位址或主機名稱?
指定網路資源,最好是使用 UNIX 主機名稱,而非數字型 IP 位址。
在建立網路資源時,使用邏輯主機名稱 (LogicalHostname 資源) 或共用的位址 (SharedAddress 資源) ,這兩者之間的差異是什麼?
除了 Sun Cluster HA for NFS 的情況外,文件提到在 Failover 模式資源群組中使用 LogicalHostname 資源時,可能會交替使用 SharedAddress 資源或 LogicalHostname 資源。使用 SharedAddress 資源會需要一些額外的負擔,因為叢集網路軟體是針對 SharedAddress 來配置,而不是 LogicalHostname。
使用 SharedAddress 的優點,是當您同時配置可延伸和故障轉移資料服務,而且要用戶端能夠使用相同的主機名稱來存取這兩種服務。 在此情形下,SharedAddress 資源以及故障轉移應用程式資源是包含在一個資源群組中,而可延伸的服務資源是包含在另一個資源群組中,並配置為使用 SharedAddress。 於是,可延伸和故障轉移服務均可使用 SharedAddress 資源中配置的同一組主機名稱/位址。
SunPlex 系統支援何種公用網路配接卡?
目前,SunPlex 系統支援 Ethernet (10/100BASE-T 和 1000BASE-SX Gb ) 公用網路配接卡。 因為未來可能會支援新的介面,請洽詢您的 Sun 業務代表,以取得最新的資訊。
在故障轉移中 MAC 位址扮演的角色是什麼?
發生故障轉移時,會產生新的「位址解析度通訊協定 (Address Resolution Protocol,ARP)」封包並廣播到網路上。這些 ARP 封包包含新的 MAC 位址 (節點移轉後的新實體配接卡的位址) 和舊的 IP 位址。 當網路上的另一部機器收到這些封包時,會清除其 ARP 快取記憶體中的舊 MAC-IP 對應,並使用新的資訊。
SunPlex 系統是否支援在主機配接卡的 OpenBootTM PROM 中設定 local-mac-address?=true?
不,不支援此變數。
當 NAFO 在作用中與備份的配接卡之間執行切換保護移轉時,能延遲多久?
延遲可以達數分鐘。 這是因為當完成了 NAFO 切換保護移轉時,牽涉到送出免費的 ARP。 然而,並不保證用戶端和叢集間的路由器將使用免費的 ARP。 因此,直到路由器上此 IP 位址的 ARP 快取項目逾時,還是有可能使用舊的 MAC 位址。 延遲的第二個原因是兩個 NAFO 配接卡均連接到 Ethernet 切換器。 當做了 NAFO 切換保護移轉時,NAFO 配接卡的其中一個在第二個配接卡為開啟時會是關閉的。Ethernet 切換器在必須停用連接埠,並啟用不同的連接埠,而這可能得花些時間。 另外,有了 Ethernet,在切換器和新啟用的配接卡之間就有速度溝通的問題產生。最後,在做了切換保護移轉之後,NAFO 會對啟用的配接卡做最小度的檢查,以確定一切運作正常。
所有的叢集成員是否需要相同的 root 密碼?
每個叢集成員不需要有相同的 root 密碼。 然而,所有的節點使用相同的 root 密碼可以簡化您的節點管理工作。
節點啟動的順序是否相當重要?
在大部份的情況下並不會有影響。然而,啟動順序對防止 Amnesia 是很重要的 (請參照 "法定數目和法定裝置",以取得 Amnesia 的詳細資訊)。 例如,如果節點 2 是法定裝置的所有者,而且節點 1 關機,接著您又將節點 2 關機,則您必須先啟動節點 2 再啟動節點 1。 這樣可以防止您意外啟動具有過時叢集配置資訊的節點。
我是否需要在叢集節點中鏡像本機磁碟?
可以。 雖然這種鏡像並非必要,但鏡像叢集節點的磁碟可以排除非鏡像磁碟故障而導致節點當機的情況。 鏡像叢集節點的區域磁碟的缺點,是需要較多的系統管理負擔。
叢集成員備份的問題有哪些?
您可以對叢集使用多種備份方法。 其中一種方法是令某個節點連接磁帶機/磁帶庫作為備份節點。 然後使用叢集檔案系統來備份資料。 請勿連接此節點至共用磁碟。
請參閱 Sun Cluster 3.0 12/01 系統管理手冊,以取得有關備份和復原程序的詳細資訊。
什麼原因讓多主機儲存體具備高可用性?
多主機儲存體具備高可用性,是因為有了鏡像 (或硬體式的 RAID-5 控制器) 而可以承受單一磁碟的遺失。 因為多主機儲存裝置具有一個以上的主機連接,也可以承受失去它所連接的單一節點。
SunPlex 系統支援何種叢集交互連接?
目前 SunPlex 系統支援 Ethernet (100BASE-T Fast Ethernet 和 1000BASE-SX Gb) 叢集交互連接。
"電纜"和傳輸"路徑有何不同?"
叢集傳輸電纜是使用傳輸配接卡和切換器來配置的。 電纜是以元件對元件方式連接配接卡和切換器。 叢集拓樸管理者使用可用的電纜來建立節點之間的點對點傳輸路徑。 電纜並不會直接對應至傳輸路徑。
電纜是由管理者做靜態的"啟用"和"停用"。 電纜有"狀況" (啟用或停用),但非"狀態"。如果電纜是啟用的,其就如同尚未配置。停用的電纜無法用作傳輸路徑。 由於電纜不是探測式的,所以無法得知它們的狀態。 電纜的狀況可使用 scconf -p 來檢視。
傳輸路徑並非由叢集拓樸管理者動態建立的。 傳輸路徑的"狀態"是由拓樸管理者決定。 路徑的狀態可以是"線上"或"離線"。傳輸路徑的狀態可以使用 scstat(1M) 來檢視。
請考慮下述具四條電纜的兩個節點叢集範例。
node1:adapter0 to switch1, port0 node1:adapter1 to switch2, port0 node2:adapter0 to switch1, port1 node2:adapter1 to switch2, port1 |
有兩個可能的傳輸路徑可由這四條電纜形成。
node1:adapter0 to node2:adapter0 node2:adapter1 to node2:adapter1 |
使用叢集需要考慮任何特殊的用戶端需求或限制嗎?
用戶端系統連接至叢集,與連接至任何其他伺服器相同。 在某些情況下,視資料服務應用程式而定,您可能需要安裝用戶端軟體或執行其它配置變更,使得用戶端可以連接至資料服務應用程式。 請參閱 Sun Cluster 3.0 12/01 Data Services Installation and Configuration Guide 中的個別章節,以取得有關用戶端配置需求的其它資訊。
SunPlex 系統需要管理主控台嗎?
是的。
管理主控台必須專屬於叢集,或者可以用於其它作業嗎?
SunPlex 系統不需要專用的管理主控台,但是使用專用主控台可以有以下優點:
在同一機器上將主控台和管理工具分組,達到中央化叢集管理
讓您的硬體服務供應商可較快速地解決問題
管理主控台位置必須"靠近" 叢集本身,例如在同一房間中?
請洽詢您的硬體服務供應商。 供應商可能會要求主控台位置要靠近叢集本身。 將主控台置於同一房間中,並無技術上的原因。
一部管理主控台在符合距離要求的前提下,可以服務一個以上的叢集嗎?
可以。 您可以從單一管理主控台來控制多個叢集。 您也可以在叢集之間共用單一的終端機集線器。
系統需要終端機集線器嗎?
所有以 Sun Cluster 3.0 為始的軟體版本不需要終端機集線器來執行。 不似 Sun Cluster 2.2 產品需要終端機集線器作為故障隔離之用,之後的產品並不依靠終端機集線器。
我發覺大部分的 SunPlex 伺服器需要終端集線器,但是 E10000 則不用。這是什麼原因呢?
終端機集線器對大部份的伺服器而言,實際上是一個串列對 Ethernet 轉換器。 其主控台是串列埠。 Sun Enterprise E10000 server 沒有串列主控台。「系統服務處理器」(SSP) 是主控台,是透過 Ethernet 或 jtag 埠。 對於 Sun Enterprise E10000 server,您一定要使用 SSP 於主控台。
使用終端機集線器有些什麼樣的好處?
使用終端機集線器可以提供,從網路上任何位置的遠端工作站以主控台層次來存取每一個節點,包括節點是在 OpenBoot PROM (OBP) 時。
如果我使用的並非 Sun 所支援的終端機集線器時,我該知道些什麼才能讓我想用的合乎標準呢?
Sun 支援的終端機集線器與其它主控台裝置的主要差異,是 Sun 終端機集線器具有特殊的韌體可以防止終端機集線器在開機時送出中斷。 請注意,如果您的主控台裝置會送出中斷,或可能會被解釋為中斷的信號,它將會關閉節點。
我是否可以釋放在 SUN 所支援的終端機集線器上已鎖定的連接埠,而不需重新將它啟動?
可以。 請注意,連接埠號碼需要重設並執行下述:
telnet tc Enter Annex port name or number:cli annex:su - annex# admin admin :reset port_number admin :quit annex# hangup # |
請參照 Sun Cluster 3.0 12/01 系統管理手冊,以取得配置和管理 Sun 支援之終端機集線器的詳細資訊。
萬一終端機集線器本身故障,要怎麼辦?我必須要有另一個備用的嗎?
不需要。如果終端機集線器故障,您並不會失去任何叢集可用性。 但是您會失去連接節點主控台的能力,直到集線器回復服務為止。
如果我真的使用終端機集線器,其安全性如何?
一般而言,終端機集線器是連接至系統管理員所使用的小型網路,不是連接到其它用戶端存取的網路。 您可以藉由限制該特定網路的存取權來控制安全性。