Oracle Cloud Infrastructure 上使用 DataSynapse GridServer 進行金融服務業分析

銀行和金融服務組織正快速轉向雲端部署關鍵任務財務分析,這些分析通常需要內部高效能運算 (HPC) 資源。越來越多的競爭與法規促使更多公司關注雲端,因而不斷增加的財務分析工作負載。

Oracle Cloud Infrastructure (OCI) 提供全方位的第二代雲端基礎架構,可讓銀行和金融服務組織快速部署雲端以進行財務分析。Oracle 在管理和分析客戶資料方面擁有豐富且豐富的經驗,因此能夠在雲端基礎架構中提供這些資源。

DataSynapse GridServer (TIBCO 的軟體產品) 是一種可高度擴展的軟體基礎架構,可讓應用程式服務以虛擬的方式運作,而不會將這些服務與任何特定的硬體資源連結。GridServer 透過能夠輕鬆處理多個要求,以高度可擴展的方式,動態向可用的硬體資源佈建服務要求。

架構

GridServer 是在 OCI 上的各種 HPC 叢集上進行測試,包括各種運算執行處理資源配置,包括裸機 (BM) 和虛擬機器 (VM)。這些叢集是使用 OCI 資源管理程式中的 HPC 堆疊建立,此堆疊使用地形樣板,其中包含將執行處理集合轉換為功能性 HPC 叢集的零件。堆疊可用來新增網路檔案共用 (NFS) 磁碟區、額外的區塊磁碟區,或是其他檔案系統 (例如 OCI 檔案儲存服務)。建立測試 HPC 叢集之後,會依照軟體安裝指示安裝 GridServer。

測試的叢集是以下列架構為基礎。



datasynapse-gridserver-oci-architecture.zip

架構具有下列元件:

  • 區域

    Oracle Cloud Infrastructure 區域是一個本地化的地理區域,包含一或多個資料中心 (稱為可用性網域)。區域與其他區域無關,因此廣大的距離可加以區隔 (跨國家或甚至洲)。

  • 可用性網域

    可用性網域是區域內的獨立資料中心。每個可用性網域中的實體資源會與其他可用性網域中的資源隔離,以提供容錯能力。可用性網域並不共用基礎設施,例如電力或冷卻系統或內部可用性網域網路。因此,一個可用性網域發生失敗並不會影響區域中的其他可用性網域。

  • 虛擬雲端網路 (VCN) 和子網路

    VCN 是您在 Oracle Cloud Infrastructure 區域中設定的可自訂軟體定義網路。就像傳統的資料中心網路,VCN 可讓您完全控制網路環境。VCN 可以有多個非重疊 CIDR 區塊,而您可以在建立 VCN 之後進行變更。您可以將 VCN 區隔成子網路,然後對區域或可用性網域進行調整。每個子網路都是由不與 VCN 中其他子網路重疊的連續位址範圍所組成。您可以在建立子網路後變更其大小。子網路可以是公用網路或專用子網路。

  • 動態路由閘道 (DRG)

    DRG 是一個虛擬路由器,可為 VCN 與區域外部網路之間的 VCN (例如另一個 Oracle Cloud Infrastructure 區域中的 VCN、企業內部部署網路或其他雲端提供者中的網路) 之間的專用網路流量提供路徑。

  • 網站至網站 VPN

    網站至網站 VPN 可讓企業內部部署網路與 Oracle Cloud Infrastructure 中 VCN 之間的 IPSec VPN 連線。IPSec 通訊協定套件會先加密 IP 流量,再將封包從來源傳輸至目的地,並在抵達時將流量解密。

  • 內部部署網路

    此網路是貴組織使用的區域網路。它是拓樸的軸輻之一。

  • 目的地主機

    堡壘主機是一種運算執行處理,可作為安全、受控制的進入點,從雲端外部存取拓樸。堡壘主機通常會以示範區域 (DMZ) 佈建。它可以讓您將機密資源放在無法直接從雲端外部存取的專用網路中,以保護機密資源。拓樸具有單一已知進入點,可供您定期監督與稽核。因此,您可以避免洩露拓樸較敏感的元件,而不會影響這些元件的存取。

  • 路由表

    虛擬路由表包含規則,可將流量從子網路遞送至 VCN 外部的目的地,通常透過閘道。

  • 安全清單

    您可以為每個子網路建立安全規則,以指定必須允許進出子網路的來源、目的地和流量類型。

  • 區塊磁碟區

    有了區塊儲存磁碟區,您就可以建立、連附、連線與移動儲存磁碟區,以及變更磁碟區效能,以符合儲存、效能及應用程式需求。將磁碟區連附和連線到執行處理之後,您便可以像使用一般硬碟一樣使用該磁碟區。您也可以中斷磁碟區連線,然後將其連附到另一個執行處理,而不會遺失資料。

  • 身分識別與存取管理 (IAM)

    Oracle Cloud Infrastructure Identity and Access Management (IAM) 是 Oracle Cloud Infrastructure (OCI) 和 Oracle Cloud Applications 的存取控制層。IAM API 和使用者介面可讓您管理識別網域和識別網域內的資源。每個 OCI IAM 識別網域代表獨立身分識別與存取管理解決方案或其他使用者群體。

  • 物件儲存

    物件儲存可快速存取任何內容類型的大量結構化與非結構化資料,包括資料庫備份、分析資料,以及豐富內容 (例如影像和影片)。您可以安全地儲存,然後直接從網際網路或雲端平台內擷取資料。您可以無縫擴充儲存,而不會發生任何效能或服務可靠性的降低。針對快速、立即和經常存取的「熱」儲存,使用標準儲存。將封存儲存用於長時間且鮮少存取的「冷」儲存。

建立 GridServer 叢集之後,系統就會使用 OpenGamma 程式庫 Stata-Examples 的案例執行基準。初次測試顯示,在單一公用執行處理上放置 GridServer Director、Broker 及 Client,以獲得最佳效能與價格與效能組合,並在個別運算執行處理上使用引擎。BM 和 VM 資源配置都已針對 GridServer Director、Broker、從屬端執行處理進行測試,效能沒有觀察到的差異。下表提供已測試叢集的描述。

引擎元件 每一節點的引擎數 引擎節點 總共的引擎
BM.Optimized3.36 36,72* 4-64 4608
BM.Standard.E4.128 256* 4-8 2048
BM.Standard2.52 52* 4-8 416
VM.Standard.E4.Flex 128* 4-8 1024

測試期間在部分系統上已啟用或停用超繫線功能。啟用「超繫線」時取得的結果會以星號 (*) 表示。在 OCI 中,實體核心稱為 OCPU。依照預設,GridServer 會為每個核心設定單一引擎。啟用「超繫線」時,GridServer 會將引擎指派給兩個核心繫線 (每個節點的可用引擎數目加倍)。VM 資源配置 VM.Standard.E4.Flex 可使用可變的 OCPU 數目設定。針對我們的測試,我們設定了每個型態 64 個 OCPU (已啟用超繫線功能的 128 個引擎)。

我們的測試使用 GridServer 進行 25,000 個獨特的 OpenGamma 分析,模擬典型的 Monte Carlo 基準測試。我們從 GridServer 主控台的工作摘要取得每個測試的經歷時間。我們會針對每個叢集執行測試,從使用四個引擎進行模擬,然後每個測試增加引擎數目,直到使用叢集內執行引擎的所有節點為止。下圖根據各種資源配置執行處理顯示叢集的測試結果。



此處的結果會以每秒的評估顯示,叢集執行蒙地卡羅模擬評估的速度。對於每個基準,此值只是模擬總數 (25,000) 除以模擬經歷時間 (秒)。整體而言,對於每個測試的叢集而言,效能會與使用的引擎數目幾乎線性地調整。就各種執行處理資源配置觀察到的相對效能而言,節點效能和每個資源配置的核心數目有很大的關聯性,表示每個核心引擎的效能與資源配置略有不同。具有 BM.Optmized3.36 資源配置的叢集已經啟用和停用「超繫線」兩種資源配置測試。對其他資源配置進行的測試,其效果與偏好的超繫線相同,而且此資料已離開圖表以清晰度。

雖然績效是大規模蒙地卡羅分析的關鍵因素,但成本也是因素。我們透過以下圖表繪製 OCI 總成本來進行上述測試 (使用 Oracle 網站上公佈的價格)。



理想上,總模擬成本不應隨著叢集大小而改變,但平行低效率往往會隨著叢集的大小增加,從而增加模擬成本。由於業績有所改善,而所有商業實務一般假設價格折衷,而且這並不不同。我們的 OpenGamma 測試顯示,以 AMD EPYC (BM.Standard.E4.128、VM.Standard.E4.Flex) 為基礎的形狀提供最佳的節點效能和價格效能。我們鼓勵客戶利用 30 天免費試用在 OCI 上測試其財務模型,因為不同的模型可能較適合其他 HPC 資源配置。

探索更多

深入瞭解如何在 Oracle Cloud Infrastructure 上部署 DataSynapse GridServer。

檢閱下列額外資源:

確認

作者

  • Martin Feyereisen

提供者

  • Nico Cheong