工作流程範例
此範例工作流程顯示車輛工程團隊如何使用高效能運算平台來降低設計成本、提升效率及提升整體價值。
設定基礎架構
基礎架構工程師會在 Oracle Cloud Infrastructure (OCI) 裸機系統上快速啟動雙節點 HPC 叢集。基礎架構工程師選擇 BM.Optimized3.36
資源配置,此資源配置專為需要 RDMA 高頻率處理器核心的高效能運算工作負載所設計。因此,「基礎架構工程師」可以使用 Oracle 的叢集網路預先建置解決方案,透過資源管理程式快速佈建叢集,並且可以使用開源 Slurm、Altair PBS Professional 或 Oracle Cloud SDK/CLI 等工具將此步驟自動化。
「基礎架構工程師」會連線至新佈建的叢集,並確保叢集上已設定所有必要的模擬軟體、視覺化節點、主機檔案、MPI 程式庫、檔案系統 (例如 NFS)、批次排程器 (例如 Slurm Workload Manager) 以及 Ansible 工具。此外,基礎架構工程師還會執行快速延遲測試,確保 RDMA 正確設定 (延遲必須介於 1 - 3 微秒之間),然後再將其傳遞給設計工程師。
執行模型
設計工程師會存取叢集,並使用 Ansible 命令檔在雙節點叢集間快速安裝摩托車標準模型。此範例使用以 Intel MPI 編譯的 OpenFOAM。
若要執行模擬,設計工程師會移至堡壘主機節點,使用 Slurm Workload Manager 排程啟動工作。工程師可以排定第一個工作,並在 72 個核心叢集中執行,其他工作仍在佇列中。由於它只是 2 個節點叢集,因此其他節點會佈建成 8 個節點,以執行所有 4 個工作。當每個工作完成時,對應的節點會自動終止以節省成本。工程師可以擷取每個工作 ID 的結果,並在完成每個工作後收到通知。
設計工程師可以在圖形處理單位虛擬機器 (GPU VM) 的 ParaView 中,取得其中一個模擬輸出並建立其模型。例如,模型可能顯示氣流、壓力、亂流或其他參數。

run-summary.png 圖解描述
設計工程師可以執行快速指令碼,將模型輸出儲存至 Oracle Cloud Infrastructure Object Storage 以供日後使用。工程師可以將整個模擬流程自動化並上傳至物件儲存。
如有需要,他們可以使用 Oracle Cloud Infrastructure FastConnect 將資料從本機提取回,而不會產生任何輸出費用。
顯示資料
以下範例為 Oracle Cloud Infrastructure (OCI) HPC 與內部部署系統的模擬時間的模擬時間,並顯示從 OCI 上執行 HPC 與內部部署環境相比所節省的整體時間以及關聯的成本。在此範例中,一個 8 節點的 OCI HPC 叢集總計使用了 2 小時,而每個核心使用 $0.075 美元,這個金額為每小時 2.70 美元或 2 小時總計 21.60 美元。
在實際的應用程式中,在雲端中運行所節省的成本和時間通常比此特定範例大。藉由在雲端散發或完全移轉至雲端,隨選容量可實現更快速的迭代和現有模型的改進,從而加速產品設計、效能和發布時間。

manager-dashboard.png 圖解描述