Oracle Cloud InfrastructureでDataSynapse GridServerを使用した金融サービス業界分析の有効化
銀行と金融サービス企業は、ミッションクリティカルな財務分析を展開するためにクラウドにすばやく目を向け、多くの場合、高性能コンピューティング(HPC)リソースを内部的に利用できないようにする必要があります。競争や規制の強化により、財務分析のワークロードの増加に応じてクラウドを検討する企業が増えています。
Oracle Cloud Infrastructure (OCI)は、銀行や金融サービス組織が財務分析のためにクラウドを迅速に展開できるようにする、包括的な第2世代のクラウド・インフラストラクチャを提供します。Oracleは、顧客データの管理と分析について深く幅広い経験を有しており、クラウド・インフラ内にそのようなリソースを提供できます。
TIBCOのソフトウェア製品であるDataSynapse GridServerは、アプリケーション・サービスを特定のハードウェア・リソースに結び付けず、仮想化された方法で動作できるようにする、拡張性の高いソフトウェア・インフラストラクチャです。GridServerは、複数のリクエストをすぐに処理する機能を通じて、サービス・リクエストをスケーラビリティの高い方法で、使用可能なハードウェア・リソースに動的にプロビジョニングします。
アーキテクチャ
GridServerは、ベア・メタル(BM)や仮想マシン(VM)などの様々なコンピュート・インスタンス・シェイプで構成される、OCI上の様々なHPCクラスタでテストされました。これらのクラスタは、OCI Resource ManagerのHPCスタックを使用してインスタンス化されました。このスタックでは、インスタンスのコレクションを機能的なHPCクラスタに変える部分を含むterraformテンプレートが使用されます。スタックでは、ネットワーク・ファイル共有(NFS)ボリューム、追加のブロック・ボリューム、または別のファイル・システム(OCI File Storageサービスなど)を追加できます。テストHPCクラスタがビルドされた後、ソフトウェアのインストール手順に従ってGridServerがインストールされました。
テストされるクラスタは次のアーキテクチャに基づいています。
datasynapse-gridserver-oci-architecture.zip
アーキテクチャには、次のコンポーネントがあります。
- リージョン
Oracle Cloud Infrastructureリージョンは、可用性ドメインと呼ばれる1つ以上のデータ・センターを含むローカライズされた地理的領域です。リージョンは他のリージョンから独立しており、広大な距離で(複数の国または複数の大陸にまたがる)リージョンを分離できます。
- 可用性ドメイン
可用性ドメインは、リージョン内の独立したスタンドアロン・データ・センターです。各可用性ドメイン内の物理リソースは、他の可用性ドメイン内のリソースから分離されているため、フォルト・トレランスが提供されます。可用性ドメインどうしは、電力や冷却、内部可用性ドメイン・ネットワークなどのインフラを共有しません。そのため、ある可用性ドメインでの障害がリージョン内の他の可用性ドメインに影響することはほとんどありません。
- 仮想クラウド・ネットワーク(VCN)およびサブネット
VCNは、Oracle Cloud Infrastructureリージョンで設定する、カスタマイズ可能なソフトウェア定義のネットワークです。VCNは、従来のデータ・センター・ネットワークと同様に、ネットワーク環境の完全な制御を可能にします。VCNには重複しない複数のCIDRブロックを含めることができ、VCNの作成後にそれらを変更できます。VCNをサブネットにセグメント化して、そのスコープをリージョンまたは可用性ドメインに設定できます。各サブネットは、VCN内の他のサブネットと重複しない連続した範囲のアドレスで構成されます。サブネットのサイズは、作成後に変更できます。サブネットはパブリックにもプライベートにもできます。
- Dynamic routing gateway (DRG)
DRGは、VCNとリージョン外部のネットワーク(別のOracle Cloud InfrastructureリージョンのVCN、オンプレミス・ネットワーク、別のクラウド・プロバイダ内のネットワークなど)間の、同じリージョン内のVCN間のプライベート・ネットワーク・トラフィックのパスを提供する仮想ルーターです。
- サイト間VPN
サイト間VPNは、オンプレミス・ネットワークとOracle Cloud InfrastructureのVCN間でIPSec VPN接続を提供します。IPSecプロトコル・スイートは、パケットがソースから宛先に転送される前にIPトラフィックを暗号化し、到着時にトラフィックを復号化します。
- オンプレミス・ネットワーク
このネットワークは、組織で使用されるローカル・ネットワークです。トポロジの1つです。
- 要塞ホスト
要塞ホストは、クラウドの外部からトポロジへのセキュアで制御されたエントリ・ポイントとして機能するコンピュート・インスタンスです。要塞ホストは通常、非武装地帯(DMZ)にプロビジョニングされます。クラウドの外部から直接アクセスできないプライベート・ネットワークに機密リソースを配置することで、機密リソースを保護できます。トポロジには、定期的にモニターおよび監査できる既知のエントリ・ポイントが1つあります。そのため、トポロジへのアクセスを損なうことなく、より機密性の高いコンポーネントの公開を回避できます。
- ルート表
仮想ルート表には、サブネットからVCN外部の宛先(通常はゲートウェイ経由)へのトラフィックをルーティングするルールが含まれます。
- セキュリティ・リスト
サブネットごとに、サブネットの内外で許可する必要があるトラフィックのソース、宛先およびタイプを指定するセキュリティ・ルールを作成できます。
- ブロック・ボリューム
ブロック・ストレージ・ボリュームでは、ストレージ・ボリュームを作成、アタッチ、接続および移動し、ボリューム・パフォーマンスを変更して、ストレージ、パフォーマンスおよびアプリケーションの要件を満たすことができます。ボリュームをインスタンスにアタッチおよび接続した後は、そのボリュームを通常のハード・ドライブのように使用できます。また、データを失うことなく、ボリュームを切断して別のインスタンスにアタッチすることもできます。
- アイデンティティおよびアクセス管理(IAM)
Oracle Cloud Infrastructure Identity and Access Management (IAM) is the access control plane for Oracle Cloud Infrastructure (OCI) and Oracle Cloud Applications.IAM APIおよびユーザー・インタフェースを使用すると、アイデンティティ・ドメインおよびアイデンティティ・ドメイン内のリソースを管理できます。各OCI IAMアイデンティティ・ドメインは、スタンドアロンのアイデンティティおよびアクセス管理ソリューションまたは異なるユーザー人口を表します。
- オブジェクト・ストレージ
オブジェクト・ストレージでは、データベースのバックアップ、分析データ、イメージやビデオなどのリッチ・コンテンツなど、あらゆるコンテンツ・タイプの構造化データおよび非構造化データにすばやくアクセスできます。インターネットから直接またはクラウド・プラットフォーム内から、安全かつセキュアにデータを格納し、取得できます。パフォーマンスやサービスの信頼性を損なうことなく、シームレスにストレージを拡張できます。迅速、即時、頻繁にアクセスする必要があるホット・ストレージには、標準ストレージを使用します。長期間保持し、ほとんどまたはほとんどアクセスしないコールド・ストレージには、アーカイブ・ストレージを使用します。
GridServerクラスタが作成された後、OpenGammaライブラリのStata-Examplesのケースを使用してベンチマークが実行されました。初期テストでは、個別のコンピュート・インスタンス上にエンジンを搭載した単一のパブリック対応インスタンスにGridServer Director、BrokerおよびClientを配置して、パフォーマンスと価格とパフォーマンスの最適な組合せが得られたことが示されました。BMシェイプとVMシェイプの両方が、パフォーマンスの違いを確認せずに、GridServer Director、Broker、Clientインスタンスに対してテストされました。次の表に、テストされたクラスタの説明を示します。
| エンジンの形状 | ノード当たりのエンジン数 | エンジン・ノード | エンジン合計 |
|---|---|---|---|
| BM.Optimized3.36 | 36,72* | 4-64 | 4608 |
| BM.Standard.E4.128 | 256* | 4-8 | 2048 |
| BM.Standard2.52 | 52* | 4-8 | 416 |
| VM.Standard.E4.Flex | 128* | 4-8 | 1024 |
ハイパースレッドは、テスト中に一部のシステムで有効または無効にされました。ハイパースレッドを有効にして得られた結果は、アスタリスク(*)で示されます。OCIでは、物理コアはOCPUで示されます。デフォルトでは、GridServerはコアごとに1つのエンジンを構成します。ハイパースレッドが有効になっている場合、GridServerは2つのコアスレッドのそれぞれにエンジンを割り当て、ノードごとに使用可能なエンジンの数を2倍にします。VMシェイプVM.Standard.E4.Flexは、可変数のOCPUで構成できます。テスト用に、各シェイプを64 OCPU (ハイパースレッドが有効な合計128エンジン)で構成しました。
オラクルのテストでは、GridServerを使用して25,000の一意のOpenGamma分析を実行し、一般的なモンテカルロ・ベンチマーク・テストをシミュレートしました。GridServerコンソールのジョブ・サマリーから、各テストの経過時間を取得しました。シミュレーションに4つのエンジンを使用し、クラスタ内でエンジンを実行しているすべてのノードが使用されるまで、テストごとのエンジン数を2倍にした各クラスタでテストを実施しました。次のプロットは、様々なシェイプ・インスタンスに基づくクラスタのテスト結果を示しています。
この結果は、クラスタがモンテカルロ・シミュレーション評価を実行できる速度である1秒当たりの評価で表示されます。ベンチマークごとに、この値は単純にシミュレーションの合計数(25,000)をシミュレーション経過時間(秒)で割った値です。全体的に、テストされた各クラスタについて、使用されたエンジンの数とほぼ直線的にパフォーマンスがスケーリングされました。様々なインスタンス・シェイプで観測された相対パフォーマンスに関して、ノード・パフォーマンスとシェイプ当たりのコア数との間に強い相関がありました。これは、コア当たりのエンジンのパフォーマンスがシェイプに対して多少不変であることを示しています。BM.Optmized3.36シェイプのクラスタは、ハイパースレッドの有効化と無効化の両方を使用してテストされました。他の図形を使用したテストでは、ハイパースレッドを優先して同じ効果が表示され、このデータはわかりやすくするためにチャートから除外されました。
大規模なモンテカルロ分析ではパフォーマンスが重要な要素ですが、コストも要因となります。OCIの合計コストを次のチャートにプロットして、上記のテストについて検討しました(Oracle Webサイトに掲載されている価格を使用)。
理想的には、シミュレーションの合計コストはクラスタ・サイズによって異なるわけではありませんが、クラスタのサイズによって並列非効率性が増す傾向があり、シミュレーション・コストが増加します。すべてのビジネス・プラクティスについて、パフォーマンスの向上に見合った価格にはトレードオフがあるという一般的な仮定があり、これは変わりません。OpenGammaテストでは、AMD EPYC (BM.Standard.E4.128、VM.Standard.E4.Flex)に基づくシェイプが、最適なノード・パフォーマンスと価格パフォーマンスの両方を提供していることを示しました。様々なモデルが他のHPCシェイプにより適している可能性があるため、30日間の無料トライアルでOCIで財務モデルをテストすることをお薦めします。


