部署 BeeGFS 平行檔案系統
BeeGFS 是一個平行叢集檔案系統,以更安全的方式專注於輸入輸出效能,並設計用於輕鬆的安裝與管理。使用 BeeGFS,您可以在 Oracle Cloud Infrastructure 上建置高效能運算 (HPC) 檔案伺服器。
BeeGFS 會將使用者資料通透地分攤至多部伺服器。藉由增加系統中的伺服器和磁碟數目,您可以將檔案系統的效能和容量從小型叢集擴展至具有數千個節點的企業級系統。
架構
此參照架構使用具有單一可用性網域和區域子網路的區域。您可以在具有多個可用性網域的區域中使用相同的參照架構。不論可用性網域數目為何,建議您使用區域子網路進行部署。
下圖說明此參考架構。
![architecture-deploy-beegfs.png 的描述如下 architecture-deploy-beegfs.png 的描述如下](img/architecture-deploy-beegfs.png)
architecture-deploy-beegfs.png 圖解描述
架構包含下列元件:
- 區域
區域是由一或多個可用性網域組成的區域化地理區域。區域與其他區域無關,而且大型距離可以區隔 (跨國家或大陸)。
- 可用性網域
可用性網域是區域內獨立的獨立資料中心。每個可用性網域中的實體資源都會與其他可用性網域中的資源隔離,以提供容錯。可用性網域不會共用基礎架構,例如電源、冷卻或內部可用性網域網路。因此,一個可用性網域的失敗並不會影響區域中的其他可用性網域。
- 容錯域
容錯域是一組可用性網域內的硬體和基礎架構。每個可用性網域都有三個具有獨立電源和硬體的容錯域。當您將運算執行處理置於多個容錯域時,應用程式會容許可用性網域內的實體伺服器故障、系統維護以及許多常見的網路和電源故障。
- 虛擬雲端網路 (VCN) 和子網路
VCN 是您在 Oracle Cloud Infrastructure 區域中設定的軟體定義網路。VCN 可以區隔為子網路,這些子網路可以專屬於某個區域或可用性網域。區域特定子網域與可用性網域特定子網路可以共存於相同的 VCN 中。子網路可以是公用或專用。
- 安全清單
您可以為每個子網路建立安全規則,以指定子網路中必須允許的來源、目的地以及流量類型。
- 路由表
虛擬路由表包含將流量從子網路路由至 VCN 外部之目的地的規則,通常會透過閘道。
- 網路閘道
網際網路閘道允許 VCN 與公用網際網路之間的流量。
- 從屬端節點
從屬端是存取 BeeGFS 檔案系統的運算執行處理。
- 管理伺服器
管理伺服器 (MGS) 是 BeeGFS 描述資料、儲存體和從屬端服務的會議點。MGS 會儲存一或多個檔案系統的組態資訊,並將此資訊提供給其他主機。此全域資源可支援多個檔案系統。
- 中繼資料服務
描述資料服務 (MDS) 會儲存資料的相關資訊,例如目錄資訊、檔案與目錄擁有權,以及儲存體目標上使用者檔案內容的位置。描述資料服務是一項擴展服務,表示您可以在 BeeGFS 檔案系統中使用一或多個描述資料服務。
描述資料內容會儲存在稱為描述資料目標 (MDT) 的磁碟區上。
- 物件儲存服務
物件儲存體服務 (OSS) 是儲存使用者檔案內容或資料區塊檔案的主要服務。物件儲存體伺服器也稱為儲存體伺服器。
與描述資料服務類似,物件儲存服務是以橫向擴展設計為基礎。作業系統執行處理有一或多個物件儲存目標。
每個儲存體伺服器都可讓您存取一組稱為物件儲存體目標 (OST) 的儲存體磁碟區。每個 OST 都包含數個代表檔案資料的二進位物件。
建議
您的需求可能會與此處描述的架構不同。使用下列建議作為起點。
- VCN
建立 VCN 時,請判斷每個子網路中的雲端資源需要多少 IP 位址。使用「無類別網域間路由 (CIDR)」表示法,指定足以容納所需 IP 位址的子網路遮罩和網路位址範圍。請使用標準專用 IP 位址空間內的位址範圍。
選取未與內部部署網路重疊的位址範圍,以便您可以視需要設定 VCN 與內部部署網路之間的連線。
建立 VCN 之後,您就無法變更其位址範圍。
設計子網路時,請考量您的流量和安全需求。將同一層或角色內的所有運算執行處理連附至可作為安全界限的相同子網路。
- 安全清單
您可以使用安全清單來定義套用至整個子網路的傳入和傳出規則。
- 防禦主機
防禦主機是用來存取專用子網路中的任何節點。使用 VM.Standard。E2.1 資源配置。
- 管理伺服器 (MGS)
因為 MGS 不是密集資源,所以您可以選擇將它與 MDS 伺服器一起建置。如果您個別部署,VM.Standard2.2 資源配置就已足夠。
使用 50GB 平衡的效能層區塊磁碟區。如果需要更多空間,可以調整區塊磁碟區的大小。
- 描述資料服務 (MDS) 伺服器
使用 VM.Standard2.8 或更新版本的資源配置。需求取決於您的工作負載是否為描述資料負載 (適用於小型檔案工作負載)、每一節點執行中的描述資料執行處理數目等等。
為獲得最高效能,建議使用裸機資源配置 (例如 BM.Standard2.52),因為它有兩個實體 NIC,每個 NIC 都有 25-Gbps 網路速度。使用一個 NIC 作為封鎖儲存的所有流量,並使用另一個 NIC 作為從屬端節點之 MDS 節點的內送資料。
使用區塊磁碟區儲存體;每個部署需求的大小和數目會變更以達到更多儲存體。如果需要更多空間,可以調整區塊磁碟區的大小。
- 物件儲存服務 (OSS) 伺服器
使用 VM.Standard2.8 或更新版本。需求取決於檔案系統中 GBps 所需的聚總 IO 傳輸量。
為獲得最高效能,建議使用裸機資源配置 (例如 BM.Standard2.52),因為它有兩個實體 NIC,每個 NIC 都有 25-Gbps 網路速度。針對區塊儲存的所有流量使用一個 NIC,並使用另一個 NIC 將內送資料從屬端節點傳送至 OSS 節點。
- 從屬端節點
根據您的部署計畫選擇 VM 資源配置。此資源配置決定可供執行處理讀取及寫入檔案系統的網路頻寬。例如,VM.Standard2.16 資源配置的網路頻寬上限為 16.4 Gbps,這表示最大 IO 傳輸量為 2.05 GBps。
從屬端可以使用 Intel 和 AMD VM 以及裸機運算資源配置。
考量
- 效能
若要獲得最佳效能,請選擇具有適當頻寬的正確運算資源配置。
- 使用狀態
請考慮根據您的建置需求使用高可用性選項。
- 成本
裸機服務提供更高的網路頻寬,但需要較高的成本。評估您的需求以選擇適當的運算資源配置。
- 監督和警示
視需要設定 MGS、MDS 和 OSS 節點的 CPU 和記憶體使用狀況監督和警示,以擴大或縮小 VM 資源配置。
建置
您可以在 GitHub 上取得此參照架構的 Terraform 程式碼。
您可以使用 Terraform 命令檔直接部署,或透過 Oracle Cloud Infrastructure Resource Manager 服務進行部署。
- 前往 GitHub。
- 將儲存區域複製或下載到您的本機電腦。
- 若要使用 Terraform 指令碼,請遵循
README
文件中的指示。 - 若要使用 Oracle Cloud Infrastructure Resource Manager,請遵循儲存庫之
orm
目錄中的README
指示。