Sun Cluster 3.0 12/01 概念

第 2章 重要概念 - 硬體服務供應商

本章說明有關 SunPlex 系統配置的硬體元件的重要概念。 涵蓋的主題包含:

SunPlex 系統硬體元件

本資訊主要是針對硬體服務供應商。 這些概念可以協助服務供應商在安裝、配置或維修叢集硬體之前,瞭解各硬體元件之間的關係。 叢集系統管理員可能也會發現,這項資訊對於安裝、配置和管理叢集軟體是很有用的。

叢集是由數個硬體元件所組成,包括:

SunPlex 系統可以讓您將這些元件結合成各種配置,請參閱 "Sun Cluster 拓樸範例" 之說明。

下圖顯示範例叢集配置。

圖 2-1 兩個節點的叢集配置範例

Graphic

叢集節點

叢集節點是執行 Solaris 作業環境和 Sun Cluster 軟體的機器,也是叢集的目前成員 (叢集成員) 或潛在成員。 Sun Cluster 軟體可讓您在一個叢集中有二到八個節點。 請參閱 "Sun Cluster 拓樸範例",以取得支援的節點配置。

叢集節點一般是連接到一或多個多重主機磁碟。 未連接到多重主機磁碟的節點,是使用叢集檔案系統來存取多重主機磁碟。 例如,一個可延伸的服務配置可以讓節點不需要直接連接到多重主機磁碟便可處理要求。

此外,平行資料庫配置中的節點會共用對於所有磁碟的並行存取。 請參閱 "多主機磁碟"第 3章, 重要概念 - 管理和應用程式設計,以取得平行資料庫配置的詳細資訊。

叢集中的所有節點會依照一般名稱,即叢集名稱 (用來存取和管理叢集),來加以分群。

公用網路配接卡會將節點連接到公用網路,以供用戶端存取叢集。

叢集成員是透過一或多個實體上獨立的網路來與叢集上的其他節點通訊。 此組實體上獨立的網路是被視為叢集交互連接

當另一個節點加入或離開叢集時,叢集中的每個節點都會知道。 此外,叢集中的每個節點也都知道本機正在執行的資源,以及在其它叢集節點上執行的資源。

相同叢集中的節點必須有類似的處理程序、記憶體和 I/O 能力,以便啟動故障轉移,而不至於大幅降低效能。 由於可能發生故障轉移,所以每個節點必須有足夠的額外容量,可以作為備份或次要節點來接管所有節點的工作負荷。

每一個節點會啟動其個別的 root (/) 檔案系統。

叢集硬體成員的軟體元件

若要作為叢集成員,必須安裝下列軟體:

請參閱 Sun Cluster 3.0 12/01 軟體安裝手冊,以取得有關如何安裝 Solaris 作業環境、Sun Cluster 和容體管理軟體的資訊。

請參閱 Sun Cluster 3.0 12/01 Data Services Installation and Configuration Guide,以取得有關如何安裝和配置資料服務的資訊。

請參閱 第 3章, 重要概念 - 管理和應用程式設計,以取得前述軟體元件的概念資訊。

下圖提供共同運作以建立 Sun Cluster 軟體環境之軟體元件的高階觀點。

圖 2-2 Sun Cluster 軟體元件的高階關係

Graphic

請參閱 第 4章, 常見問題,以取得有關叢集成員的問題與解答。

多主機磁碟

Sun Cluster 需要可同時連接一個以上節點的磁碟之多主機磁碟儲存體。 在 Sun Cluster 環境中,多主機儲存體可讓磁碟非常有用。

多主機磁碟有下列特性:

容體管理者提供鏡像或 RAID-5 配置的多主機磁碟資料冗餘。 目前,Sun Cluster 支援 Solstice DiskSuiteTM 和 VERITAS Volume Manager 作為容體管理者,以及 Sun StorEdgeTM A3x00 儲存單位中的 RDAC RAID-5 硬體控制器。

結合多主機磁碟和磁碟鏡像與資料分置,可以防止節點故障和個別的磁碟故障。

請參閱 第 4章, 常見問題,以取得有關多主機儲存體的問題與解答。

多重初始端 SCSI

本節僅適用於 SCSI 儲存裝置,不適用於多主機磁碟的「光纖通道」(Fibre Channel) 儲存體。

在獨立式伺服器中,伺服器節點是以連接此伺服器至特定 SCSI 匯流排的 SCSI 主機配接卡電路,來控制 SCSI 匯流排活動。 此 SCSI 主機配接卡電路即為 SCSI 初始端 (SCSI initiator)。 這個電路起始此 SCSI 匯流排的所有匯流排活動。 SCSI 主機配接卡的預設 SCSI 位址在 Sun 系統中是 7。

叢集配置利用多主機磁碟在多伺服器節點之間共用儲存體。 當叢集儲存體是由單端或差動式 SCSI 裝置所組成時,該配置即為多重初始端 SCSI。 這個詞彙所隱含的意義,即 SCSI 匯流排上存在一個以上的 SCSI 初始端。

SCSI 規格需要 SCSI 匯流排上的每一個裝置均具有一個唯一的 SCSI 位址。 (主機配接卡也是 SCSI 匯流排上的一個裝置。) 在多重初始端環境中的預設硬體配置會導致衝突,因為所有的 SCSI 主機配接卡預設為 7。

若要解決衝突,在每個 SCSI 匯流排上,留下其中一個 SCSI 主機配接卡的 SCSI 位址為 7,並將其它的主機配接卡設定為未用的 SCSI 位址。 請適當地規劃指定這些"未用的" SCSI 位址,包括目前和最後未使用的位址。 將來不使用的位址範例,是安裝新磁碟到空磁碟插槽以便增加儲存體。 在大部份配置中,第二主機配接卡的可用 SCSI 位址為 6。

您可以藉由設定 scsi-initiator-id Open Boot PROM (OBP) 屬性,變更選取的主機配接卡的 SCSI 位址。您可以全域式或以個別主機配接卡的方式,來設定節點的這個屬性。 有關設定每一個 SCSI 主機配接卡的唯一 scsi-initiator-id 的指示在 Sun Cluster 3.0 12/01 Hardware Guide 中各磁碟機殼的章節中有所說明。

本機磁碟

本機磁碟是僅連接至單一節點的磁碟。 因此,沒有節點故障的保護 (不具高可用性)。 然而,所有的磁碟 (包括本機磁碟) 均含括於全域名稱空間中,並且配置為 整體裝置。 因此,從所有的叢集節點可以看到磁碟本身。

您可以將本機磁碟上的檔案系統放在整體裝載點下,讓其它節點使用。 如果目前裝載這些整體檔案系統之其中一個檔案系統的節點故障,所有節點均會遺失該檔案系統的存取。 使用容體管理者可讓您鏡像這些磁碟,如此磁碟故障就不會導致這些檔案系統變成無法存取,但是容體管理者無法防止節點故障。

請參閱 "整體裝置" 一節,以取得有關整體裝置的詳細資訊。

抽換式媒體

叢集中支援如磁帶機和 CD-ROM 光碟機的抽換式媒體。 一般而言,您安裝、配置和維修這些裝置的方式與在非叢集環境的方式相同。 這些裝置是配置為 Sun Cluster 中的整體裝置,所以每一個裝置均可從叢集的任何節點來存取。 請參照 Sun Cluster 3.0 12/01 Hardware Guide,以取得安裝和配置抽換式媒體的資訊。

請參閱 "整體裝置" 一節,以取得有關整體裝置的詳細資訊。

叢集交互連接

叢集交互連接是用來傳輸叢集節點之間的叢集私有通訊與資料服務通訊的實體裝置配置。 由於交互連接廣泛使用於叢集私有通訊,所以會限制效能。

只有叢集節點可以連接至叢集交互連接。 Sun Cluster 安全性模型假設只有叢集節點具有實體存取叢集交互連接。

所有的節點必須透過至少兩個實體上多餘的獨立網絡或路徑,藉由叢集交互連接來連接,才能避免單點故障的情形。 任何兩個節點之間可以有多個實體上獨立的網路 (二到六個)。 叢集交互連接由三個硬體元件組成:配接卡、接點與電纜。

下表說明各個硬體元件。

請參閱 第 4章, 常見問題,以取得有關叢集交互連接的問題與解答。

公用網路介面

用戶端透過公用網路介面連接至叢集。 每一個網路配接卡可以連接至一或多個公用網路,這要根據配接卡是否有多重硬體介面而定。 您可以設定節點來包含多個配置的公用網路介面卡,如此一來,當一個介面卡為作用中時,其它介面卡就作為備用。 Sun Cluster 軟體有一個子系統稱為 "公用網路管理" (PNM),可監督作用中的介面。 如果作用中配接卡故障,會呼叫「網路配接卡故障轉移」(Network Adapter Failover,NAFO) 軟體,將介面移轉至備用配接卡。

公用網路介面的叢集不需要特別的硬體注意事項。

請參閱 第 4章, 常見問題,以取得有關公用網路的問題與解答。

用戶端系統

用戶端系統包括工作站或透過公用網路存取叢集的其它伺服器。 伺服器端應用程式提供在叢集上執行的資料或其他服務,供用戶端程式使用。

用戶端系統不具高可用性。 叢集上的資料和應用程式則具高可用性。

請參閱 第 4章, 常見問題,以取得有關用戶端系統的問題與解答。

主控台存取裝置

對於所有的叢集節點,您必須擁有主控台存取權。 若要取得主控台存取,請使用與您叢集硬體一起購買的終端機集線器、 Sun Enterprise E10000 伺服器 上的「系統服務處理器」(System Service Processor,SSP)、 Sun FireTM 伺服器上的系統控制器,或是可以存取每個節點上 ttya 的其它裝置。

Sun 支援的終端機集線器只有一個,而是否使用此支援的 Sun 終端機集線器是可選擇的。 終端機集線器允許使用 TCP/IP 網路來存取每一個節點上的 /dev/console。 所以可從網路上任意位置的遠端工作站,以主控台層次來存取每一個節點。

「系統服務處理器」(SSP) 提供 Sun Enterprise E10000 伺服器 的主控台存取。 SSP 是 Ethernet 網路上的機器,配置為支援 Sun Enterprise E10000 伺服器。SSP 是 Sun Enterprise E10000 伺服器 的管理主控台。 使用「Sun Enterprise E10000 網路主控台」功能,網路上的任何工作站皆可開啟主機主控台階段作業。

其它的主控台存取方法包括其它終端機集線器,從另一個節點和無智型終端機的 tip(1) 串列埠存取。 您可以使用 SunTM 鍵盤和監視器,或其它串列埠裝置 (如果您的硬體服務供應商支援這些裝置)。

管理主控台

您可以使用專用的 SPARCstationTM 系統,即管理主控台,來管理作用中的叢集。 通常,您在管理主控台上所安裝和執行的管理工具軟體,會是像 Sun Management Center 產品的「叢集控制面板」(Cluster Control Panel,CCP) 和 Sun Cluster 模組。 使用 CCP 下的 cconsole 可讓您一次連接一個以上的節點主控台。 請參閱 Sun Cluster 3.0 12/01 系統管理手冊,以取得有關使用 CCP 的詳細資訊。

管理主控台不是叢集節點。 您使用管理主控台,透過公用網路或選擇透過網路型終端機集線器,來遠端存取叢集節點。如果您的叢集是由 Sun Enterprise E10000 平台所組成,您必須能夠從管理主控台登入「系統服務處理器」(SSP),並使用 netcon(1M) 指令連接。

一般您會配置沒有監視器的節點。 然後,透過管理主控台的 telnet 階段作業來存取節點的主控台,管理主控台連接至終端機集線器,並從終端機集線器連接至節點的串列埠。 (如果是 Sun Enterprise E10000 伺服器,您是從「系統服務處理器」連接。) 請參閱 "主控台存取裝置",以取得詳細資訊。

Sun Cluster 不需要專用的管理主控台,但是使用專用主控台可以有以下優點:

請參閱 第 4章, 常見問題,以取得有關管理主控台的問題與解答。

Sun Cluster 拓樸範例

拓樸是指連接叢集節點和叢集中所使用儲存體平台的連接機制。

Sun Cluster 支援下列拓樸架構:

以下各節包含說明每一種拓樸架構的圖表。

叢集化配對拓樸架構

叢集化配對拓樸架構是二個或以上的節點配對,在單一叢集管理框架之下運作。 在此配置中,故障轉移僅發生於配對之間。 然而,所有的節點以叢集交互連接來連接,並在 Sun Cluster 軟體控制下運作。 您可能會使用這種拓樸架構,在某個配對上執行平行資料庫應用程式,而在另一個配對上執行故障轉移或可延伸的應用程式。

利用叢集檔案系統,您也可以讓兩個配對的配置,其中有兩個以上的節點執行可延伸服務或平行資料庫,即使所有的節點均未直接連接儲存應用資料的磁碟。

下圖說明叢集化配對配置。

圖 2-3 叢集化配對拓樸架構

Graphic

Pair+M 拓樸

此項 pair+M 拓樸中包含一對直接連接共用儲存體的節點與附加節點組,並使用叢集交互連接來存取共用儲存體,其本身並未具備直接連接。

下圖說明 pair+M 拓樸,其中四個節點的兩個 (節點 3 和節點 4) 使用叢集交互連接來存取儲存體。 此項配置可加以擴展,以便納入其它並未具有可直接存取共用儲存體的節點。

圖 2-4 Pair+M 拓樸

Graphic

N+1 (星狀) 拓樸

N+1 拓樸架構包括一些主要節點和一個次要節點。 您不需要配置相同的主要節點和次要節點。 主要節點主動提供應用程式服務。 在等待主要節點故障時,次要節點不需要閒置。

次要節點在配置中是唯一實際連接至所有多主機儲存體的節點。

如果主要節點上發生故障,Sun Cluster 會移轉資源至次要節點繼續運作,直到轉換 (自動或手動) 回到主要節點為止。

次要節點必須時常保有足夠的額外 CPU 容量,以便在主要節點之一故障時處理負載。

下圖說明 N+1 配置。

圖 2-5 N+1 拓樸架構

Graphic