ワークフローの例

このサンプル・ワークフローは、車両エンジニアリング・チームが高パフォーマンスのコンピュート・プラットフォームを使用して設計コストを削減し、効率性を高め、全体的な価値を高める方法を示しています。

Infrastructureの設定

エンジニアは、オンプレミス環境でキューイング時間が長くなり、72コアを必要とするシミュレーションをいくつか実行する必要があります。デザイン・エンジニアは、シミュレーションを実行し、数時間以内に結果を経営陣に報告する必要があります。ただし、オンプレミスHPC環境の待ち時間は5日です。デザイン・エンジニアは、インフラストラクチャを迅速に起動してシミュレーションを実行するためのサポートをインフラストラクチャ・エンジニアに依頼します。

インフラストラクチャ・エンジニアは、Oracle Cloud Infrastructure (OCI)ベア・メタル・システムで2ノードのHPCクラスタを迅速に起動します。インフラストラクチャ・エンジニアはBM.Optimized3.36シェイプを選択します。これは、RDMAを使用した高周波数プロセッサ・コアを必要とする高パフォーマンス・コンピューティング・ワークロード用に設計されています。これにより、インフラストラクチャ・エンジニアは、Oracleのクラスタ・ネットワーキングの事前構築済ソリューションを使用してリソース・マネージャを介してクラスタを迅速にプロビジョニングでき、オープン・ソースのSlurm、Altair PBS Professional、Oracle Cloud SDK/CLIなどのツールを使用してこのステップを自動化できます。

インフラストラクチャ・エンジニアは、新しくプロビジョニングされたクラスタに接続し、必要なすべてのシミュレーション・ソフトウェア、ビジュアライゼーション・ノード、ホスト・ファイル、MPIライブラリ、ファイル・システム(NFSなど)、バッチ・スケジューラ(Slurm Workload Managerなど)、およびAnsibleツールがクラスタ上に設定されていることを確認します。さらに、インフラストラクチャ・エンジニアは迅速なレイテンシ・テストを実行し、RDMAをデザイン・エンジニアに渡す前に、RDMAが適切に設定されていることを確認します(レイテンシは1から3マイクロ秒の間である必要があります)。

モデルの実行

設計エンジニアはクラスタにアクセスし、Ansibleスクリプトを使用して、2ノード・クラスタ全体にバイク標準モデルをすばやくインストールします。この例では、Intel MPIでコンパイルされた OpenFOAMを使用します。

シミュレーションを実行するには、設計エンジニアが要塞ノードに移動し、Slurm Workload Managerスケジュールを使用してジョブを開始します。エンジニアは最初のジョブをスケジュールし、72コアクラスタ全体で実行し、ほかのジョブはキュー内に残ります。2ノード・クラスタのみであるため、4つのジョブをすべて実行するために、追加のノードが8ノードにプロビジョニングされます。各ジョブが完了すると、対応するノードが自動的に終了し、コストを節約できます。エンジニアは、各ジョブIDの結果を取得し、各ジョブの完了後に通知を受信できます。

設計エンジニアは、シミュレーション出力のいずれかを取得し、グラフィック処理ユニット仮想マシン(GPU VM)上のParaViewでモデル化できます。たとえば、モデルには通気、圧力、乱流、または別のパラメータが表示されます。

run-summary.pngの説明が続きます
図run-summary.pngの説明

設計エンジニアは、クイック・スクリプトを実行して、後で使用するためにモデル出力をOracle Cloud Infrastructure Object Storageに保存できます。このエンジニアは、シミュレーション・プロセス全体を自動化し、オブジェクト・ストレージにアップロードできます。

必要に応じて、Oracle Cloud Infrastructure FastConnectを使用して、エグレス料金を発生させることなくローカルにデータを取り戻すことができます。

データの表示

この例では、テクニカル・オペレーション・マネージャーが、シミュレーションがクラウドに要した時間とそのコストに関心を持っています。HPC使用状況データはデータベースで取得され、コスト分析に使用されます。

次の例は、Oracle Cloud Infrastructure (OCI) HPCでのシミュレーション時間とオンプレミス・システムからのシミュレーション時間との比較であり、OCIでのHPCの実行とオンプレミス、および関連するコストから節約された全体的な時間を示しています。この例では、8ノードのOCI HPCクラスタが合計2時間使用され、コア当たり$0.075で、これは1時間当たりのインスタンス当たり$2.70、合計$21.60になります(2時間)。

実際のアプリケーションでは、通常、クラウドでの実行によるコストと時間の節約は、この特定の例よりも重要です。クラウドにバーストしたり、クラウドに完全に移行したりすることで、オンデマンドの容量によって、より迅速な反復と既存のモデルの改善が可能となり、製品の設計、パフォーマンスおよびリリースまでの時間を短縮できます。

manager-dashboard.pngの説明が続きます
図manager-dashboard.pngの説明