Sun Studio 12: Fortran プログラミングガイド

10.1.2 プログラムの並列化のための手順

次に、アプリケーションの並列化に必要な手順について、極めて一般的な概要を示します。

  1. 最適化。適切なコンパイラオプションのセットを使用して、1 つのプロセッサ上で最高のパフォーマンスを得ます。

  2. プロファイル。典型的なテストデータを使用して、プログラムのパフォーマンスプロファイルを決定します。もっとも重要なループを見つけます。

  3. ベンチマーク。逐次処理でのテストの結果が正確かどうかを決定します。これらの結果とパフォーマンスプロファイルをベンチマークとして使用します。

  4. 並列化。オプションと指令の組み合わせを使用して、並列化した実行可能ファイルをコンパイルし、構築します。

  5. 検証。並列化したプログラムを 1 つのプロセッサや 1 つのスレッド上で実行し、結果を検査して、その中の不安定さやプログラミングエラーを見つけます。$PARALLEL または$OMP_NUM_THREADS に 1 を設定します。「10.1.5 スレッドの数」を参照してください。

  6. テスト。複数のプロセッサ上でさまざまな実行を試し、結果を検査します。

  7. ベンチマーク。専用のシステムで、プロセッサの数を変えながらパフォーマンスを測定します。問題のサイズを変化させて、性能の変化を測定します (スケーラビリティー)。

  8. ステップ 4 〜 7 を繰り返します。パフォーマンスに基づいて、並列化スキームを改良します。