Punch Torino:Oracle Cloud 上的高效能運算 (HPC) 叢集部署
為了加快計算流體動力學模擬的執行時間,義大利 tier-1 引擎製造商 Punch Torino 將 CFD 平台搬移至 Oracle Cloud Infrastructure (OCI)。
利用 Oracle Cloud Infrastructure 高效能運算 (HPC)、打卡 Torino 的工程師現在能夠執行 CPU、記憶體及 I/O 密集模擬和測試工作負載,速度最高可加快 24%,運算核心速度則減少 33%。
在 Punch-of-concept 完成後,Punch Torino 生產環境的合作夥伴與高效能運算顧問公司 Doit Systems 合作。
在 Oracle Cloud Infrastructure 租用戶中,Punch Torino 執行了 Abaqus、Converge、StarCCM+、Optistruct 應用系統。
在 Oracle Cloud Infrastructure 上打卡 Torino 部署的唯一功能包括:
- HPC 裸機伺服器與 Oracle 叢集網路結合,因此可藉由聚合式乙太網路 (RoCE) v2 存取超高低延遲 RDMA (<2 μs 延遲跨越數十萬核心的叢集)
- 輕鬆使用 HPC 自動化工具,在幾分鐘內縱向擴展及縮減裸機伺服器
- Oracle 平面、雙層網路拓樸在所有節點提供統一的頻寬和延遲,讓 HPC 叢集能夠以線性方式擴展
- 高 I/O 傳輸量儲存,將連附至裸機執行處理的本機 6.4TB NVMe SSD
對於未來部署,Punch Torino 也考慮:
- 新的運算執行處理類型,例如 Optimized X9
- FastConnect 可傳輸更多資料,並在 GPU 節點上的遠端階段作業降低延遲時間
架構
自內部部署存取控制中心 Web 應用程式 (Altair Access Web 應用程式) 使用虛擬專用網路 (VPN) 來存取多倫諾的使用者,這些應用程式是 Altair Access Web 應用程式。內部部署 Active Directory 系統使用 Oracle Cloud Infrastructure Identity and Access Management 來執行認證,因此使用者無法直接存取高效能運算 (HPC) 叢集。
控制節點會視需要啟動 HPC 叢集節點。在節點就緒之後,控制節點會將工作分成數個部分,然後提交並行處理。Control Scheduler 會透過 REST API 自動調整運算節點。HPC 叢集可視需要佈建裸機執行處理。模擬通常會在 5 到 6 個小時內完成。
- 模擬需要使用連附至裸機執行處理之 6.4TB NVMe SSD 本機儲存所提供的熱儲存高 I/O 傳輸量。
- 結果會儲存在供分析的暖 (檔案) 儲存中。
- 遠端圖形分析階段作業會將檔案複製到已連附至 VM 執行處理的熱 (區塊) 儲存,以進行快速轉譯。
下圖說明此參照架構。
下圖說明資料在架構中的流動方式:
- 使用者可從內部部署存取和控制中心起始對應用程式的存取。
- 內部部署 Active Directory 會認證使用者。
- 內部部署授權伺服器提供可用的授權。
- 內部部署存取和控制中心可視需要啟動 HPC 叢集節點。
- 使用者將模擬檔案 (最多 50 GB) 上傳至檔案 (「暖」) 儲存。
- 模擬檔案會複製到本機 SSD ("hot「) 儲存,結果會儲存至檔案儲存。
- 內部部署存取和控制中心可視需要啟動視覺化節點。
- 模擬檔案會從檔案儲存複製到區塊 ("hot「) 儲存,以供視覺化節點處理。
- 結果會儲存至物件 (「冷」) 儲存,以供長期儲存。
架構具有下列元件:
- 區域
Oracle Cloud Infrastructure 區域是一個局部地理區域,其中包含一或多個資料中心 (稱為可用性網域)。區域獨立於其他區域,而且很大距離可加以區隔 (跨國家或甚至是大陸)。
- 身分識別與存取管理 (IAM)
Oracle Cloud Infrastructure Identity and Access Management (IAM) 可讓您控制在 Oracle Cloud Infrastructure 中存取資源的人員,以及他們可對這些資源執行的作業。
- 稽核
Oracle Cloud Infrastructure Audit 服務會將所有支援的 Oracle Cloud Infrastructure 公用應用程式設計介面 (API) 端點作為日誌事件自動記錄呼叫。所有服務目前都支援 Oracle Cloud Infrastructure Audit 的記錄功能。
- 可用性網域
可用性網域是區域內的獨立獨立資料中心。每個可用性網域中的實體資源會與提供容錯能力的其他可用性網域中的資源隔離。可用性網域並不共用基礎設施,例如電源或冷卻系統,或內部可用性網域網路。因此,一個可用性網域發生故障並不會影響該區域中的其他可用性網域。
- 虛擬雲端網路 (VCN) 和子網路
VCN 是您在 Oracle Cloud Infrastructure 區域中設定的可客製化的軟體定義網路。與傳統的資料中心網路一樣,VCN 會提供您完整的網路環境控制。VCN 建立 VCN 之後,便可以有多個非重疊的 CIDR 區塊。您可以將 VCN 區隔到子網路,成為區域或可用性網域的範圍。每個子網路都會包含連續的位址範圍,而不會與 VCN 中的其他子網路重疊。您可以在建立子網路後變更其大小。子網路可以是公用或專用子網路。
- 安全清單
對於每個子網路,您可以建立安全規則,指定必須進出子網路的來源、目的地和流量類型。
- 路由表
虛擬路由表包含將流量從子網路遞送至 VCN 外部 (通常透過閘道) 的規則。
- 動態路由閘道 (DRG)
DRG 是一個虛擬路由器,可提供 VCN 與區域外部網路 (例如另一個 Oracle Cloud Infrastructure 區域、內部部署網路或另一個雲端提供者中的網路) 之間專用網路流量的路徑。
- 高效能運算
專為需要高頻率處理器核心和叢集網路的高效能運算工作負載所設計,可提供大規模的平行 HPC 工作負載。
搭配 Oracle 叢集網路的Oracle Cloud Infrastructure 裸機伺服器可藉由聚合式乙太網路 (RoCE) v2,存取超高延遲 RDMA (< 2 μs 延遲跨越數萬核心的叢集)。
- 虛擬機器
Oracle Cloud Infrastructure Compute 服務可讓您在雲端佈建及管理運算主機。您可以使用資源配置啟動運算執行處理,使其符合 CPU、記憶體、網路頻寬及儲存的資源需求。建立運算執行處理之後,您可以安全地存取它、重新啟動該運算執行處理、連附及取消連附磁碟區,並在不再需要時終止該磁碟區。
Oracle 裸機伺服器提供客戶專屬運算執行處理,不論是隔離環境、可見性還是控制。伺服器支援需要高核心數目、大量記憶體及高頻寬的應用程式。可擴展至 160 個核心 (業界中最大的)、2 TB RAM 和最多 1 PB 的區塊儲存。客戶可以建置在 Oracle 裸機伺服器上的雲端環境,大幅提升其他公有雲和企業內部部署資料中心的效能。
- 物件儲存
物件儲存可讓您快速存取各種內容類型的結構化和非結構化資料,包括資料庫備份、分析資料,以及像是影像與影片之類的豐富內容。您可以安全地儲存,然後直接從網際網路或雲端平台內擷取資料。您不必遇到效能或服務可靠性降低的情況,就能以無縫接軌的方式調整儲存。針對需要快速、立即且經常存取的「熱」儲存,使用標準儲存。使用封存儲存作為長期存放、極少或少存取的「冷」儲存。
- 檔案儲存
Oracle Cloud Infrastructure File Storage 服務提供持久、可擴展且安全的企業級網路檔案系統。您可以從 VCN 中的任何裸機、虛擬機器或容器執行處理連線至檔案儲存服務檔案系統。您也可以使用 Oracle Cloud Infrastructure FastConnect 和 IPSec VPN 從 VCN 外部存取檔案系統。
- 區塊磁碟區
有了區塊儲存磁碟區,您就可以建立、連附、連線與移動儲存磁碟區,以及變更磁碟區效能,以符合儲存、效能及應用程式需求。連附磁碟區並連線到執行處理之後,您便可以像使用一般硬碟一樣使用該磁碟區。您也可以將磁碟區中斷連線再連附到另一個執行處理,而不會遺失資料。
取得建置和部署的功能
想要顯示您在 Oracle Cloud Infrastructure 上建置的項目嗎?是否要與我們的全球雲端架構師社群來分享學員、最佳做法和參考架構?讓我們幫助您開始使用。
- 下載範本 (PPTX)
將圖示拖放至範例線框中,可說明自己的參照架構。
- 觀看架構教學課程
一步瞭解如何建立參考架構的指示。
- 提交您的圖表
用您的圖表寄電子郵件給我們。我們的雲端架構師會審核您的圖表,並與您聯絡以討論您的架構。
探索更多
深入瞭解此架構的功能。
Oracle Cloud Infrastructure 的相關資訊:
相關參考架構:
- 在 Oracle Cloud Infrastructure 上部署高效能運算 (HPC)
- 運用高效能運算 (HPC) 部署虛擬桌面基礎架構 (VDI)
- 高效能運算:Oracle Cloud Infrastructure 上的 OpenFOAM
- 高效能運算:Oracle Cloud Infrastructure 上的 LS-DYNA
- 高效能運算:Oracle Cloud Infrastructure 上的 Ansys Fluent
此架構中使用之元件的 Terraform 程式碼:
- 高效能運算 - RDMA 叢集網路 (Oracle Cloud Marketplace)
- Oracle Cloud Infrastructure - Github 中的高效能運算 (Github)

