Sun Cluster 3.0 概念

第 2章 重要概念 - 硬體服務供應商

本章說明有關 Sun Cluster 配置的硬體元件的重要概念。

Sun Cluster 硬體元件

本資訊主要是針對硬體服務供應商。這些概念可以協助服務供應商在安裝、配置或維修叢集硬體之前,瞭解各硬體元件之間的關係。叢集系統管理者也會發現,這項資訊對於安裝、配置和管理叢集軟體很有用。

叢集是許多硬體元件所組成,包括:

Sun Cluster 可讓您將這些元件結合成各種的配置,說明於 "Sun Cluster 拓樸"

下圖顯示範例叢集配置。

圖 2-1 兩個節點的叢集配置範例

Graphic

叢集節點

叢集節點是執行 Solaris 作業環境和 Sun Cluster 軟體的機器,也是叢集的目前成員 (cluster member) 或潛在成員。 Sun Cluster 軟體可讓您在一個叢集中有二到八個節點。請參閱 "Sun Cluster 拓樸" 以取得所支援的節點配置。

叢集節點均連接到一或多個多主機磁碟。可延伸的服務配置可讓節點能服務未直接連接到多重主電腦磁碟的要求。未連接到多重主電腦磁碟的節點,是使用檔案系統來存取多重主電腦磁碟。

在平行資料庫配置中,節點共用並行存取所有的磁碟。請參閱 "多主機磁碟"第 3章, 重要概念 - 管理和應用程式設計 以取得平行資料庫配置的其他資訊。

叢集中的所有節點會依照一般名稱來分類-叢集名稱-用來存取和管理叢集。

公用網路配接卡連接節點到公用網路,提供用戶端存取叢集。

叢集成員透過一或多個實際獨立的網路 (稱為 私有網絡) 與叢集的其它節點通訊。 這組叢集中的私有網路稱為 cluster interconnect

當另一個節點加入或離開叢集時,叢集中的每個節點都會知道。此外,叢集中的每個節點 也都知道本端執行的資源以及在其它叢集節點上執行的資源。

配置叢集成員的資源 (應用程式、磁碟儲存體等等),使其能夠提供失效保護及/或可延伸功能。

確定相同叢集中的節點有類似的處理程序、記憶體和 I/O 能力,以便啟動失效保護,而不至於大幅降低效能。 因為可能發生失效保護,請確定每個節點有足夠的額外容量,可以接管所有節點的工作負荷,作為備份或次要。

每一個節點啟動其自己的個別 root (/) 檔案系統。

叢集成員的軟體元件

要作為叢集成員,必須安裝下列的軟體:

一種例外情形是在使用硬體多餘備用獨立磁碟陣列 (RAID) 的 Oracle Parallel Server(OPS) 配置中。這種配置不需要軟體容體管理者,如 Solstice DiskSuite 或 VERITAS 容體管理者 以便來管理 Oracle 資料。

請參閱 Sun Cluster 3.0 安裝手冊 以取得有關如何安裝 Solaris 作業環境、Sun Cluster 和 容體管理軟體的資訊。請參閱 Sun Cluster 3.0 Data Services Installation and Configuration Guide 以取得有關如何安裝和配置數據服務的資訊。

請參閱 第 3章, 重要概念 - 管理和應用程式設計 以取得前述軟體元件的概念資訊。

下圖提供共同運作以建立 Sun Cluster 軟體環境之軟體元件的高階觀點。

圖 2-2 Sun Cluster 軟體元件的高階關係

Graphic

請參閱 第 4章, 常見問題 以取得有關叢集成員的問題與解答。

多主機磁碟

Sun Cluster 需要多主機磁碟儲存體:可以一次連接至超過一個節點的磁碟。在 Sun Cluster 環境中,多重主電腦磁碟可讓磁碟裝置非常有用。位於多主機儲存體上的磁碟裝置可以承受單一節點失效。

多主機磁碟儲存應用資料,也可以儲存數據服務二進位檔案和配置檔。

多主機磁碟是透過「主控」磁碟的主要節點來全域存取,或透過區域路徑直接並行存取。目前使用直接並行存取的唯一應用程式是 OPS。

多主機磁碟可以防止節點失效。如果用戶端要求是透過某個節點來存取資料而該節點失效,這些要求會切換為使用另一個可直接連接同一磁碟的節點。

容體管理者提供鏡映或 RAID-5 配置的多主機磁碟資料多餘備用性。目前,Sun Cluster 支援 Solstice DiskSuite 和 VERITAS 容體管理者 作為容體管理者,以及 Sun StorEdgeTM A3x00 儲存單位中的 RDAC RAID-5 硬體控制器。

結合多主機磁碟和磁碟映射與資料分置,可以防止節點失效和個別的磁碟失效。

請參閱 第 4章, 常見問題 以取得有關多主機儲存體的問題與解答。

多重起始者 SCSI

本節僅適用於 SCSI 儲存裝置,不適用於多主機磁碟的「光纖通道 (Fibre Channel)」儲存體。

在獨立式伺服器中,伺服器節點是以連接此伺服器至特定 SCSI 匯流排的 SCSI 主機配接卡電路,來控制 SCSI 匯流排活動。此 SCSI 主機配接卡電路即為 SCSI initiator。 這個電路起始此 SCSI 匯流排的所有匯流排活動。SCSI 主機配接卡的預設 SCSI 位址在 Sun 系統中是 7。

叢集配置在多重伺服器節點之間共用記憶體。當叢集儲存體是由單端或差動式 SCSI 裝置所組成時,該配置即為多重起始者 SCSI。依照這個詞彙所衍生的意義,即 SCSI 匯流排上存在一個以上的 SCSI 起始者。

SCSI 規格需要 SCSI 匯流排上的每一個裝置均具有一個唯一的 SCSI 位址。 (主機配接卡也是 SCSI 匯流排上的一個裝置。) 在多重起始者環境中的預設硬體配置會導致衝突, 因為所有的 SCSI 主機配接卡預設為 7。

若要解決衝突,在每個 SCSI 匯流排上,留下其中一個 SCSI 主機配接卡的 SCSI 位址是 7, 並將其它的主機配接卡設定為未用的 SCSI 位址。請適當地規劃指定這些「未用的」SCSI 位址,包括 目前和最後未使用的位址。未來未使用的位址範例,是安裝新磁碟到空磁碟插槽以便增加儲存體。 在大部份配置中,第二主機配接卡的可用 SCSI 位址是 6。

您可以藉由設定 scsi-initiator-id Open Boot PROM (OBP) 性質, 變更選取的主機配接卡的 SCSI 位址。您可以全域式或以個別主機配接卡的方式,來設定節點的這個性質。 設定每一個 SCSI 主機配接卡的唯一 scsi-initiator-id,其指示包含在 Sun Cluster 3.0 Hardware Guide 中各磁碟外殼的章節。

區域磁碟

區域磁碟是僅連接至單一節點的磁碟。因此,沒有節點失效的保護 (不具高可用性)。然而,所有的磁碟 (包括區域磁碟) 均含括於整體名稱空間中,並且配置為 整體裝置。 因此,從所有的叢集節點可以看到磁碟本身。您可以將這些磁碟上的檔案系統放在整體裝載點下,讓 其它節點使用。如果目前裝載這些整體檔案系統之其中一個檔案系統的節點失效, 所有節點均會遺失該檔案系統的存取。使用容體管理者可讓您鏡映這些磁碟,如此磁碟失效就不會導致 這些檔案系統變成無法存取,但是容體管理者不能防止節點失效。

抽換式媒體

叢集中支援如磁帶機和 CD-ROM 光碟機的抽換式媒體。一般而言,您安裝、配置和維修這些裝置的 方式與在非叢集環境的方式相同。這些裝置是配置為 Sun Cluster 中的整體裝置,所以每一個裝置均可自叢集的任何節點來存取。請參照 Sun Cluster 3.0 Hardware Guide 以取得安裝和配置抽換式媒體的資訊。

叢集交互連接

此項 cluster interconnect 是用來傳輸叢集節點之間的叢集私有通訊與數據服務通訊的實體裝置配置。因為交互連接廣泛使用於叢集私有通訊,所以會限制效能。

只有叢集節點可以連接至私有交互連接。Sun Cluster 安全性模型假設只有叢集節點具有實體存取私有交互連接。

必須透過至少兩個多餘備用私有網絡或路徑,藉由叢集交互連接來連接所有的節點,才能避免單一失效點的情形。任何兩個節點之間可以有多個私有網路 (二到六個)。叢集交互連接由三個硬體元件所組成:配接卡、接點和電纜。每一個私有網路的配置,會使其不會與任何其它私有網路共用共同的硬體元件。

下表說明各個硬體元件。

請參閱 第 4章, 常見問題 以取得有關叢集交互連接的問題與解答。

公用網路介面

用戶端透過公用網路介面連接至叢集。每一個網路配接卡可以連接至一或多個公用網路, 根據配接卡是否有多重硬體介面而定。您可以設定節點來包含多個配置的公用網路介面卡,如此一來,一個介面卡在作用中,其它介面卡就作為備用。Sun Cluster 軟體有一個子系統稱為"「公用網路管理」" (PNM) ,可監督作用中的介面。如果作用中配接卡失效,會呼叫「網路配接卡失效保護 (NAFO)」軟體,將介面移轉至備用配接卡。

公用網路介面的叢集不需要特別的硬體注意事項。

請參閱 第 4章, 常見問題 以取得有關公用網路的問題與解答。

用戶端系統

用戶端系統包括工作站或透過公用網路存取叢集的其它伺服器。用戶端程式使用由伺服器端應用程式執行於叢集所提供的資料或其它服務。

用戶端系統不具高可用性。叢集上資料和應用程式則具高可用性。

請參閱 第 4章, 常見問題 以取得有關用戶端系統的問題與解答。

管理主控台

您可以使用專用的 SPARCstationTM 系統,即管理主控台,來管理作用中的叢集。 通常,您在管理主控台上所安裝和執行管理工具軟體,會像是 Sun Management Center 產品的「叢集控制台 (CCP)」和 Sun Cluster 模組。使用 CCP 下的 cconsole 可讓您一次連接一個以上的節點主控台。 如果需要使用 CCP 的其他資訊,請參閱 Sun Cluster 3.0 系統管理手冊

管理主控台不是叢集節點。您使用管理主控台,透過公用網路或選擇透過網路型終端機集線器,來遠端存取叢集節點。如果您的叢集是由 SunTM Enterprise E10000 平台所組成,您必須能夠從管理主控台登入「系統服務處理器 (SSP)」使用 netcon(1M) 指令連接。

一般而言,您配置沒有監視器的節點。然後,您透過管理主控台上的 telnet 階段作業 來存取節點的主控台,管理主控台連接至終端機集線器,以及從終端機集線器至節點的串列埠。 (如果是 Sun Enterprise E10000 server,您是從「系統服務處理器」連接。) 請參閱 "主控台存取裝置" 以取得其他資訊。

Sun Cluster 不需要專用的管理主控台,但是使用專用主控台可以有以下優點:

請參閱 第 4章, 常見問題 以取得有關管理主控台的問題與解答。

主控台存取裝置

您必須可以主控台存取所有的叢集節點。要取得主控台存取,請使用向您的叢集硬體購買的 終端機集線器、Sun Enterprise E10000 server 伺服器上的「系統服務處理器 (SSP)」或是可以存取每個節點上 ttya 的其它裝置。

從 Sun 只能取得一個支援的終端機集線器。使用支援的 Sun 終端機集線器是可選用的。 終端機集線器允許使用 TCP/IP 網路來存取每一個節點上的 ttya。 結果是從網路上任意位置的遠端工作站,以主控台層次存取每一個節點。

「系統服務處理器 (SSP)」提供主控台存取 Sun Enterprise E10000 server。 SSP 是 Ethernet 上的 SPARCstation 系統,配置為支援 Sun Enterprise E10000 server。 SSP 是 Sun Enterprise E10000 server 的管理主控台。使用「Sun Enterprise E10000 網路主控台」功能,網路上的任何工作站皆可開啟主機主控台階段作業。

其它的主控台存取方法包括其它終端機集線器,tip(1) 從另一個節點和沈默式終端機的串列埠存取。您可以使用 SunTM 鍵盤和監視器,或其它串列埠裝置 (如果您的硬體服務供應商支援這些裝置)。

請參閱 第 4章, 常見問題 以取得有關主控台裝置的問題與解答。

Sun Cluster 拓樸

拓樸是指連接叢集節點與叢集使用之儲存體平台的連接機制。

Sun Cluster 支援下列拓樸架構:

以下各節說明每一種拓樸架構。

叢集化配對拓樸架構

叢集化配對拓樸架構是二個或以上的節點配對,在單一叢集管理組織架構之下運作。 在此配置中,失效保護僅發生於配對之間。然而,所有的節點以私有網路連接,並在 Sun Cluster 軟體控制下運作。您可能使用這種拓樸架構,在某個配對上執行平行資料庫應用程式, 而在另一個配對上執行高可用性應用程式。利用叢集檔案系統,您也可以讓兩個配對的配置, 其中有兩個以上的節點執行可延伸服務或平行資料庫,即使所有的節點均未直接連接儲存應用資料 的磁碟。

下圖說明叢集化配對配置。

圖 2-3 叢集化配對拓樸架構

Graphic

Pair+M 拓樸

此項 pair+M 拓樸中包含一對直接連接共用儲存體的節點與附加節點組,並使用叢集交互連接來存取共用儲存體 -其本身並未具備直接連接。在此配置中所有的節點仍然以容體管理者來加以配置。

下圖說明 pair+M 拓樸,其中四個節點的兩個 (節點 3 和節點 4) 使用叢集交互連接來存取儲存體。此項配置可加以擴展,以便納入其他並未具有可直接存取共用儲存體的節點。

圖 2-4 Pair+M 拓樸

Graphic

N+1 (星狀) 拓樸

N+1 拓樸架構包括一些主要節點和一個次要節點。您不需要配置相同的主要節點和次要節點。 主要節點主動地提供應用程式服務。等待主要節點失效時,次要節點不需要閒置。

次要節點在配置中是唯一實際連接至所有多主機儲存體的節點。

如果主要節點上發生失效,Sun Cluster 會移轉資源至次要節點繼續運作,直到轉換 (自動或手動) 回到主要節點為止。

次要節點必須時常保有足夠的額外 CPU 容量,以便在主要節點之一失效時處理負載。

下圖說明 N+1 配置。

圖 2-5 N+1 拓樸架構

Graphic