Abilita l'analisi del settore dei servizi finanziari con DataSynapse GridServer su Oracle Cloud Infrastructure

Le banche e le organizzazioni di servizi finanziari si rivolgono rapidamente al cloud per distribuire le proprie analisi finanziarie strategiche, che spesso richiedono risorse HPC (High Performance Computing) non disponibili internamente. L'aumento della concorrenza e delle normative impone a un maggior numero di aziende di esaminare il cloud i propri carichi di lavoro crescenti di analisi finanziarie.

Oracle Cloud Infrastructure (OCI) offre un'infrastruttura cloud completa di seconda generazione che consente a banche e organizzazioni di servizi finanziari di implementare rapidamente il cloud per l'analisi finanziaria. Oracle vanta un'esperienza completa e approfondita nella gestione e nell'analisi dei dati dei clienti e consente loro di fornire tali risorse all'interno della propria infrastruttura cloud.

DataSynapse GridServer, un prodotto software di TIBCO, è un'infrastruttura software altamente scalabile che consente ai servizi applicativi di operare in modo virtuale e non di collegare questi servizi a risorse hardware specifiche. GridServer esegue il provisioning dinamico delle richieste di servizio alle risorse hardware disponibili in modo altamente scalabile grazie alla possibilità di elaborare rapidamente più richieste.

Architettura

GridServer è stato testato su una vasta gamma di cluster HPC nell'infrastruttura OCI, incluse varie forme di istanza di computazione, tra cui Bare Metal (BM) e Virtual Machine (VM). Queste istanze di cluster sono state create utilizzando uno stack HPC in OCI Resource Manager, che utilizza un modello di terrenoforme contenente le parti che trasformano una raccolta di istanze in un cluster HPC funzionale. Lo stack può aggiungere volumi NFS (Network File Share), volumi a blocchi aggiuntivi o un altro file system (come il servizio di storage di file OCI). Dopo aver creato i cluster HPC di prova, GridServer è stato installato seguendo le istruzioni per l'installazione del software.

I cluster testati si basano sull'architettura seguente.



datasynapse-gridserver-oci-architecture.zip

L'architettura è dotata dei componenti elencati di seguito.

  • Area

    Un'area Oracle Cloud Infrastructure è un'area geografica localizzata che contiene uno o più data center, definiti domini di disponibilità. Le regioni sono indipendenti da altre regioni e grandi distanze possono separarle (in tutti i paesi o anche in continenti).

  • Domini di disponibilità

    I domini di disponibilità sono data center standalone indipendenti all'interno di un'area geografica. Le risorse fisiche in ciascun dominio di disponibilità sono isolate dalle risorse presenti negli altri domini di disponibilità, che offrono tolleranza agli errori. I domini di disponibilità non condividono l'infrastruttura, ad esempio alimentazione o raffreddamento o la rete interna del dominio di disponibilità. È pertanto improbabile che l'eventuale guasto di un dominio di disponibilità influenzi gli altri domini di disponibilità nell'area.

  • Rete cloud virtuale (VCN) e subnet

    Una VCN è una rete personalizzabile e definita dal software configurata in un'area Oracle Cloud Infrastructure. Analogamente alle reti di data center tradizionali, i VCN offrono il controllo completo sull'ambiente di rete. Una VCN può avere più blocchi CIDR non sovrapposti che puoi modificare dopo aver creato la VCN. Puoi segmentare una VCN nelle subnet che possono essere definite nell'area o in un dominio di disponibilità. Ogni subnet è composta da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet nella VCN. Puoi modificare le dimensioni di una subnet dopo la creazione. Una subnet può essere pubblica o privata.

  • Gateway di instradamento dinamico (DRG)

    DRG è un router virtuale che fornisce un percorso per il traffico di rete privato tra VCN nella stessa area, tra una VCN e una rete esterna all'area, come una VCN in un'altra area Oracle Cloud Infrastructure, una rete in locale o una rete in un altro provider cloud.

  • VPN da sito a sito

    VPN da sito a sito fornisce la connettività IPSec VPN tra la rete in locale e i VCN in Oracle Cloud Infrastructure. La suite di protocolli IPSec cifra il traffico IP prima che i pacchetti vengano trasferiti dall'origine alla destinazione e decifra il traffico all'arrivo.

  • Rete on premise

    Questa è la rete locale utilizzata dall'organizzazione. È uno dei raggi della topologia.

  • Host bastion

    L'host bastion è un'istanza di computazione che funge da punto di accesso sicuro e controllato alla topologia dall'esterno del cloud. Il provisioning dell'host bastion viene eseguito in genere in una zona demilitarizzata (DMZ). Consente di proteggere le risorse riservate collocandole in reti private a cui non è possibile accedere direttamente dall'esterno del cloud. La topologia ha un singolo punto di accesso noto che puoi monitorare e controllare regolarmente. In questo modo, puoi evitare di esporre i componenti più sensibili della topologia senza comprometterne l'accesso.

  • Tabella di instradamento

    Le tabelle di instradamento virtuale contengono regole per instradare il traffico dalle subnet alle destinazioni esterne a una VCN, in genere tramite gateway.

  • Lista di sicurezza

    Per ogni subnet, puoi creare regole di sicurezza che specifichino l'origine, la destinazione e il tipo di traffico che deve essere consentito all'interno e all'esterno della subnet.

  • Volume a blocchi

    Grazie ai volumi di storage a blocchi, puoi creare, collegare, connettere e spostare volumi di storage, nonché modificare le prestazioni dei volumi per soddisfare i tuoi requisiti di storage, prestazioni e applicazioni. Dopo aver collegato e connesso un volume a un'istanza, puoi utilizzare il volume con una normale unità disco fisso. Inoltre, puoi disconnettere un volume e collegarlo a un'altra istanza senza perdere i dati.

  • Gestione delle identità e degli accessi (IAM)

    Oracle Cloud Infrastructure Identity and Access Management (IAM) è il piano di controllo dell'accesso per Oracle Cloud Infrastructure (OCI) e Oracle Cloud Applications. L'interfaccia API IAM e l'interfaccia utente consentono di gestire i domini di Identity e le risorse all'interno del dominio di Identity. Ogni dominio di identità IAM OCI rappresenta una soluzione standalone di gestione delle identità e degli accessi o una popolazione di utenti diversa.

  • Storage degli oggetti

    Lo storage degli oggetti garantisce un accesso rapido a grandi quantità di dati strutturati e non strutturati di qualsiasi tipo di contenuto, inclusi backup del database, dati analitici e contenuti avanzati, ad esempio immagini e video. Puoi memorizzare i dati in tutta sicurezza e poi recuperarli direttamente da Internet o dall'interno della piattaforma cloud. Puoi ridimensionare lo storage in modo trasparente senza alcun peggioramento a livello di prestazioni o affidabilità dei servizi. Utilizza lo storage standard per lo storage "hot" a cui devi accedere in modo rapido, immediato e frequente. Utilizzare lo storage di archivio per lo storage "freddo" che si mantiene per lunghi periodi di tempo e raramente può accedere.

Dopo la creazione dei cluster GridServer, i benchmark sono stati effettuati utilizzando un caso dello Stata-Examples della libreria OpenGamma. I test iniziali hanno indicato la migliore combinazione di prestazioni e rapporto prezzo/prestazioni ottenuti posizionando GridServer Director, Broker e Client su una singola istanza rivolta verso la pubblica, con motori su istanze di computazione separate. Sia le forme BM che VM sono state testate per l'istanza client GridServer Director, Broker, senza alcuna differenza osservata a livello di prestazioni. La tabella riportata di seguito fornisce una descrizione dei cluster sottoposti a test.

Forma motore Motori per nodo Nodi motore Motori totali
BM.Optimized3.36 36,72* 4-64 4608
BM.Standard.E4.128 256* 4-8 2048
BM.Standard2.52 52* 4-8 416
VM.Standard.E4.Flex 128* 4-8 1024

L'iperthreading è stato attivato o disattivato in alcuni sistemi durante i test. I risultati ottenuti con Hyperthreading abilitato sono contrassegnati da un asterisco (*). In OCI, una memoria centrale fisica viene indicata come OCPU. Per impostazione predefinita, GridServer configura un singolo motore per memoria centrale. Quando l'iperthreading è abilitato, GridServer assegna un motore a ciascuno dei due thread principali, raddoppiando il numero di motori disponibili per nodo. La forma VM, VM.Standard.E4.Flex, è configurabile con un numero variabile di OCPU. Per i nostri test, abbiamo configurato ognuna delle forme con 64 OCPU (128 motori totali con Hyperthreading abilitato).

I nostri test hanno utilizzato GridServer per effettuare 25.000 analisi uniche OpenGamma, simulando un tipico test di benchmark Monte Carlo. È stato ottenuto il tempo trascorso per ogni test dal riepilogo del job alla console GridServer. Abbiamo effettuato i test su ciascuno dei cluster a partire dall'utilizzo di quattro motori per la simulazione, quindi raddoppiando il numero di motori per test fino a quando tutti i nodi che eseguono motori nel cluster sono stati utilizzati. Il grafico riportato di seguito mostra i risultati dei test sul cluster in base a varie istanze di forma.



Qui i risultati vengono visualizzati nelle valutazioni al secondo, la velocità in cui il cluster è in grado di eseguire le valutazioni di simulazione Monte Carlo. Per ogni benchmark, questo valore era semplicemente il numero totale di simulazioni (25.000) diviso per il tempo trascorso della simulazione in secondi. Nel complesso, per ciascuno dei cluster testati, le prestazioni si sono ridimensionate quasi in modo lineare con il numero di motori utilizzati. In termini di prestazioni relative osservate per le varie forme dell'istanza, si è verificata una correlazione significativa tra le prestazioni del nodo e il numero di memorie centrali per forma, a indicare che le prestazioni del motore per core sono state in qualche modo invarianti rispetto alla forma. Il cluster con forme BM.Optmized3.36 è stato sottoposto a test sia con Hyperthreading abilitato che disabilitato. I test con altre forme hanno lo stesso effetto se si preferisce Hyperthreading e questi dati sono stati lasciati dal grafico per maggiore chiarezza.

Sebbene le prestazioni siano un fattore critico nelle analisi Monte Carlo su larga scala, anche il costo è un fattore. Lo abbiamo esaminato per i test di cui sopra tracciando il costo OCI totale nel grafico sottostante (utilizzando i prezzi pubblicati sul sito Web Oracle).



Idealmente, il costo totale della simulazione non dovrebbe variare in base alla dimensione del cluster, ma le inefficienze parallele tendono ad aumentare con la dimensione del cluster che aumenta il costo della simulazione. Esiste un presupposto generale per tutte le pratiche commerciali che vi è un trade-off dei prezzi man mano che le prestazioni migliorano e questo non è diverso. I nostri test OpenGamma hanno mostrato che le forme basate su AMD EPYC (BM.Standard.E4.128, VM.Standard.E4.Flex) offrono le prestazioni del nodo migliori e le prestazioni di prezzo. Invitiamo i clienti a testare i loro modelli finanziari su OCI con una prova gratuita di 30 giorni, in quanto modelli diversi potrebbero essere più adatti ad altre forme HPC.

Visualizza altro

Ulteriori informazioni sulla distribuzione di DataSynapse GridServer in Oracle Cloud Infrastructure.

Esaminare le risorse aggiuntive riportate di seguito.

Conferme

Autore:

  • Martin Feyereisen

Collaboratore:

  • Nico Cheong