部署分子動態和 NAMD 應用程式

使用任何範圍從裸機到 Oracle Cloud Infrastructure (OCI) 中可用之虛擬機器 GPU 資源配置的運算架構選項,部署分子動態和 NAMD 應用程式。

NAMD 是一種分子動力學軟體,可在一組預先定義的條件下,模擬生物分子中的原子移動。它識別這些生物分子因溫度、壓力及其他輸入數據的變化而暴露在生活主義中模仿實際狀況時的行為。NAMD 可以建立保護折疊、保護連結以及細胞膜傳輸的樣式,讓它成為對藥物研究與探索的有用應用程式。

NAMD 包括下列主要功能:

  • 根據 C + +和 Charm + +平行物件,以獲得低延遲架構的最佳效能

  • 提供可擴展的零售業績效

  • 已分配免費及其來源代碼

  • 可以透過 NVIDIA A100 GPU 上執行的 3.0alpha 版本,達到九次的傳輸量

  • 基本模擬,例如透過救援、耦合或語言動力學的常數溫度

  • 進階模擬,例如化學和符合自由能源計算

架構

您可以將此參考架構用於與深入學習和科學運算相關的多個應用程式。

深度學習與科學運算工作負載需要專業的運算架構。Oracle Cloud Infrastructure (OCI) 提供各種從裸機到虛擬機器 (VM) GPU 資源配置的選項,以處理最常使用的工作負載。NVIDIA GPU Cloud (NGC) 是 Oracle Cloud Infrastructure 上可用的其中一個選項。

在此簡單參照架構中,具有區塊儲存的 GPU 節點會部署在具有公用子網路和網際網路閘道的 VCN 中。區塊儲存會儲存應用程式。

下圖說明此參考架構。



架構包含下列元件:

  • 區域

    Oracle Cloud Infrastructure 區域是包含一或多個資料中心 (稱為可用性網域) 的本地化地理區域。區域與其他區域無關,而且大型距離可以區隔 (跨國家或甚至洲)。

  • 可用性網域

    可用性網域是區域內獨立的獨立資料中心。每個可用性網域中的實體資源都會與其他可用性網域中的資源隔離,以提供容錯。可用性網域不會共用基礎架構,例如電源、冷卻或內部可用性網域網路。因此,一個可用性網域的失敗並不會影響區域中的其他可用性網域。

  • 租用戶

    租用戶是 Oracle 在您註冊 Oracle Cloud Infrastructure 時,於 Oracle Cloud 內設定的安全且隔離的分割區。您可以在租用戶內的 Oracle Cloud 中建立、組織及管理您的資源。

  • 區間

    區間是 Oracle Cloud Infrastructure 租用戶內的跨區域邏輯分割區。您可以使用區間來組織 Oracle Cloud 中的資源、控制資源的存取,以及設定使用配額。若要控制對指定區間中資源的存取,您可以定義原則,指定誰可以存取資源,以及他們可以執行的動作。

  • 雲端保全

    您可以使用 Oracle Cloud Guard 來監督及維護您在 Oracle Cloud Infrastructure 中的資源安全。「雲端保全」使用可定義的偵測器方法來檢查安全弱點的資源,以及監督操作員和使用者是否有風險活動。偵測到任何組態錯誤或不安全的活動時,雲端保全會建議更正動作,並根據您可以定義的回應器方法來協助採取這些動作。

  • 虛擬雲端網路 (VCN) 和子網路

    VCN 是您在 Oracle Cloud Infrastructure 區域中設定的可自訂軟體定義網路。VCN 就像傳統資料中心網路一樣,可讓您完全控制網路環境。VCN 可以有多個非重疊的 CIDR 區塊,供您在建立 VCN 之後變更。您可以將 VCN 區隔為子網路,子網路範圍可為區域或可用性網域。每個子網路均包含一個未與 VCN 中其他子網路重疊的連續位址範圍。您可以在建立子網路之後變更子網路的大小。子網路可以是公用或專用。

  • 網路閘道

    網際網路閘道可讓 VCN 中的公用子網路與公用網際網路之間的流量。

  • 路由表

    虛擬路由表包含將流量從子網路路由至 VCN 外部之目的地的規則,通常會透過閘道。

  • 安全清單

    您可以為每個子網路建立安全規則,以指定子網路中必須允許的來源、目的地以及流量類型。

  • 計算

    Oracle Cloud Infrastructure Compute 服務可讓您在雲端佈建及管理運算主機。您可以啟動源配置符合資源需求 (CPU、記憶體、網路頻寬以及儲存體) 的運算執行處理。建立運算執行處理之後,您可以安全地存取運算執行處理、重新啟動運算執行處理、連附及切離磁碟區,以及在不需要時終止運算執行處理。

  • 裸機 GPU

    使用裸機 GPU 資源配置進行硬體輔助分析與其他運算。

  • 區塊磁碟區

    透過區塊儲存磁碟區,您可以建立、連附、連線及移動儲存體磁碟區,以及變更磁碟區效能以符合您的儲存體、效能和應用程式需求。將磁碟區連附並連線至執行處理之後,您可以使用磁碟區,例如一般硬碟。您也可以中斷磁碟區的連線,然後將它連附至另一個執行處理,而不會遺失資料。

推薦

使用下列建議作為在 Oracle Cloud Infrastructure 上使用任何範圍的運算架構選項部署分子動態應用程式的起點。

您的需求可能會與此處描述的架構不同。

  • VCN

    建立 VCN 時,請根據計畫連附至 VCN 中子網路的資源數目,判斷所需的 CIDR 區塊數目和每個區塊的大小。使用標準專用 IP 位址空間內的 CIDR 區塊。

    選取未與想要設定專用連線之任何其他網路 (在 Oracle Cloud Infrastructure、內部部署資料中心或其他雲端提供者中) 重疊的 CIDR 區塊。

    建立 VCN 之後,您可以變更、新增及移除其 CIDR 區塊。

    設計子網路時,請考量您的流量和安全需求。將特定層或角色內的所有資源連附至可作為安全界限的相同子網路。

    使用區域子網路。

  • 安全清單

    您可以使用安全清單來定義套用至整個子網路的傳入和傳出規則。

  • 雲端保全

    複製並自訂 Oracle 提供的預設方法,以建立自訂偵測器和回應器方法。這些處方可讓您指定哪些類型的安全違規會產生警告,以及允許對它們執行哪些動作。例如,您可能想要偵測可見性設為公用的物件儲存的儲存桶。

    在租用戶層次套用雲端保全、以涵蓋最廣泛的範圍、並減少維護多個組態的管理間接成本。

    您也可以使用「受管理清單」功能,將特定組態套用至偵測器。

  • 裸機 GPU

    使用裸機資源配置 BM.GPU2.2 或 BM.GPU3.8 可獲得最佳效能。

考量

部署分子動態應用程式時,請考慮下列事項:

  • 效能

    若要獲得最佳效能,請選擇具有適當頻寬的正確運算資源配置。

  • 使用狀態

    請考慮根據您的建置需求和區域使用高可用性選項。選項包括使用區域中的多個可用性網域,以及使用容錯域。

  • 成本

    裸機 HPC 執行處理可為更高的成本提供必要的 CPU 電源。評估您的需求以選擇適當的運算資源配置。

  • 監督和警示

    設定您節點之 CPU 和記憶體使用狀況的監督和警示,讓您可以視需要擴大或縮小資源配置。

建置

您可以在 GitHub 上取得此參照架構的 Terraform 程式碼。只要按一下即可將程式碼提取至 Oracle Cloud Infrastructure Resource Manager,然後建立堆疊並加以部署。或者,您也可以使用 Terraform CLI,從 GitHub 下載程式碼到您的電腦、自訂程式碼以及建置架構。

  • 使用 Oracle Cloud Infrastructure Resource Manager 中的範例堆疊進行部署:
    1. 一下部署到 Oracle Cloud

      如果您尚未登入,請輸入租用戶和使用者證明資料。

    2. 複查並接受條款與條件。
    3. 選取要建置堆疊的區域。
    4. 依照畫面上的提示和指示建立堆疊。
    5. 建立堆疊之後,請按一下 Terraform 動作,然後選取畫。
    6. 等待工作完成,然後複查計畫。

      若要進行任何變更,請返回「堆疊詳細資訊」頁面,按一下編輯堆疊,然後進行必要的變更。然後,再次執行「畫」動作。

    7. 如果不需要進一步的變更,請返回「堆疊詳細資訊」頁面,按一下 Terraform 動作,然後選取用。
  • 使用 GitHub 中的 Terraform 程式碼進行部署:
    1. 前往 GitHub
    2. 將儲存區域複製或下載到您的本機電腦。
    3. 依照 README 文件中的指示進行。

探索更多

進一步瞭解此架構的功能。