叢集是作為單一連續可用的系統共同作業,以為使用者提供應用程式、系統資源和資料的兩個或多個系統 (或節點)。叢集中的每一個節點均是具有完整功能的獨立系統。但是,在叢集環境中,這些節點透過互連連線,並作為單一實體共同作業以提供增強的可用性和效能。
具有高度可用性的叢集透過使叢集在發生故障的整個過程中保持執行狀態,來提供對資料和應用程式的幾乎持續的存取,而這些故障通常會使單一伺服器系統當機。沒有任何單一故障 — 硬體、軟體或網路 — 可以使叢集失敗。相比之下,容錯性硬體系統雖提供對資料和應用程式的持續存取,但因為是特殊硬體,所以成本較高。容錯性系統通常無法處理軟體故障。
每個 Sun Cluster 系統是緊密連接的節點之集合,這些節點提供網路服務和應用程式的單一管理檢視。Sun Cluster 系統透過以下硬體和軟體的組合實現高度可用性:
冗餘磁碟系統提供儲存。通常,對這些磁碟系統進行鏡像,以使在磁碟或子系統失敗時作業不被中斷。磁碟系統的冗餘連線確保在伺服器、控制器或電纜出現故障時仍可存取資料。節點間的高速互連提供對資源的存取。還可將叢集中的所有節點連線至公用網路,以使多個網路上的用戶端可以存取該叢集。
可熱交換的冗餘元件 (例如電源供應器和散熱系統) 透過使系統在硬體發生故障後繼續作業改善可用性。可熱交換的元件提供在運行的系統中新增或移除硬體元件而不會使其當機的功能。
Sun Cluster 軟體的高度可用性架構可迅速偵測到節點故障,並將應用程式或服務遷移至在同一環境中執行的另一節點。任何時候都不會出現所有應用程式均不可用的情況。不受故障節點影響的應用程式在恢復期間完全可用。此外,故障節點的應用程式一經恢復之後,便可使用。已恢復的應用程式無須等待所有其他應用程式完成其恢復。
如果系統內發生任何單一軟體或硬體故障,而應用程式仍不受其影響,則表示該應用程式具有高度可用性。由應用程式自身內部的錯誤或資料毀壞導致的故障除外。以下各項適用於具有高度可用性的應用程式:
恢復過程對於使用資源的應用程式是透明的。
資源存取完全不受節點故障的影響。
應用程式無法偵測到宿主節點是否已被移至另一節點。
單一節點的故障對使用連結至該節點的檔案、裝置和磁碟容體之其餘節點上的程式是完全透明的。
防故障備用服務和可延伸服務以及並列應用程式可讓您使應用程式具有高度可用性並改善叢集上應用程式的效能。
防故障備用服務透過冗餘提供高度可用性。發生故障時,您可以將正在執行的應用程式配置為在同一節點上重新啟動,或移至叢集中另一節點,而無需使用者介入。
為提昇效能,可延伸服務平衡利用叢集中的多個節點以並行方式執行應用程式。在可延伸的配置中,叢集的每個節點均可提供資料並處理用戶端的要求。
並列資料庫可讓資料庫伺服器的多個實例執行以下作業:
加入叢集
同時處理對同一資料庫的不同查詢
在大型查詢中提供並列查詢功能
如需有關防故障備用與可延伸服務以及並列應用程式的更多資訊,請參閱資料服務類型。
用戶端透過公用網路來將要求送至叢集。每個叢集節點均透過一個或多個公用網路配接卡連線至至少一個公用網路。
IP 網路多重路徑使伺服器有連線至同一子網路的多個網路埠。首先,IP 網路多重路徑軟體透過偵測網路配接卡的故障或修復提供從網路配接卡故障恢復的功能。然後,該軟體同時將網路位址在故障配接卡和替代配接卡之間切換。當多個網路配接卡可作業時,IP 網路多重路徑透過在配接卡間分散外送的資料封包提昇資料流量。
多重主機儲存裝置透過將磁碟連線至多個節點使磁碟具有高度可用性。多節點為存取資料提供多個路徑,當某個路徑失敗時,另一個路徑可以替代它。
多重主機磁碟可允許進行以下叢集處理:
容許單一節點發生故障。
集中應用程式資料、應用程式二進位檔及配置檔案。
免受故障節點的影響。如果用戶端要求是透過失敗的某個節點來存取資料,這些要求會切換至使用另一個直接連線相同磁碟的節點。
以全域方式透過「控制」磁碟的主要節點,或透過經由本地路徑的直接並行存取來提供存取。
容體管理程式使您可以管理大量磁碟以及那些磁碟上的資料。容體管理程式透過提供以下功能,可以增加儲存容量和資料可用性:
磁碟機分條和鏈結
磁碟鏡像
磁碟機緊急備援
磁碟故障處理和磁碟更換
Sun Cluster 系統支援以下容體管理程式:
Solaris 容體管理程式
VERITAS 容體管理程式
Sun StorEdge Traffic Manager 軟體從 Solaris 作業系統 8 核心 I/O 架構開始完全整合。Sun StorEdge Traffic Manager 軟體使您可以更有效地表示和管理裝置,這些裝置可透過 Solaris 作業環境之單一實例內的多個 I/O 控制器介面存取。Sun StorEdge Traffic Manager 架構啟動以下功能:
避免由於 I/O 控制器發生故障而受到 I/O 中斷的影響
在 I/O 控制器發生故障時自動切換至替代控制器
透過在多個 I/O 通道間平衡資料流量獲得提昇的 I/O 效能
Sun Cluster 系統支援使用硬體備用獨立式磁碟陣 (RAID) 和基於主機的軟體 RAID。硬體 RAID 使用儲存陣列的硬體冗餘或儲存系統的硬體冗餘,以確保獨立硬體故障不會影響資料可用性。如果您對各個獨立的儲存陣列進行鏡像,基於主機的軟體 RAID 可確保在整個儲存陣列處於離線狀態時,獨立硬體故障不會影響資料可用性。雖然您可以並行使用硬體 RAID 和基於主機的軟體 RAID,但您僅需要一個 RAID 解決方案以維持高度的資料可用性。
由於叢集系統的固有特性之一為共用資源,因此叢集需要一個檔案系統,以滿足統一共用檔案的需要。透過 Sun Cluster 檔案系統,使用者或應用程式可使用標準的遠端或本機 UNIX API 存取任何叢集節點上的任何檔案。Sun Cluster 系統支援以下檔案系統:
UNIX 檔案系統 (UFS)
Sun StorEdge QFS 檔案系統
VERITAS 檔案系統 (VxFS)
如果將應用程式從一個節點移至另一節點,無需進行任何變更,該應用程式仍可存取相同檔案。無需進行任何變更,現有應用程式仍可完全利用叢集檔案系統。
標準的 Sun 叢集系統從單一位置提供高度可用性與穩定性。如果您的應用程式在遭受非預期的災難 (例如地震、洪水或斷電) 後必須依然可用,則可以將您的叢集配置為校園叢集。
校園叢集可讓您定位相隔數公里的單獨房間內的叢集元件,例如節點與共用儲存裝置。您可以分隔節點與共用儲存裝置,並將它們放在共用校園周圍的不同設備中或數公里以內的其他位置。當某個位置受災後,倖存的節點可以接管故障節點的服務。這使您的使用者仍可使用應用程式與資料。