Sun Studio 12:Fortran 编程指南

10.1.2 程序并行化步骤

此处列出了应用程序并行化的常规步骤:

  1. 优化。使用适当的编译器选项集,以在单个处理器上获得最佳串行性能。

  2. 配置文件。使用典型测试数据,确定程序的性能配置文件。标识最主要的循环。

  3. 基准测试。确定串行测试结果是准确的。使用这些结果以及性能配置文件作为基准。

  4. 并行化。使用选项和指令组合编译并生成并行化的可执行文件。

  5. 验证。在单个处理器和单个线程上运行并行化的程序,并检查结果,以找出可能在其中出现的不稳定性和编程错误。(将 $PARALLEL$OMP_NUM_THREADS 设置为 1;请参见10.1.5 线程数)。

  6. 测试。在几个处理器上执行各种运行以检查结果。

  7. 基准测试。在专用系统上用不同数目的处理器进行性能测量。测量性能随问题量变化的变化情况(可量测性)。

  8. 重复步骤 4 到 7。基于性能对并行化方案进行改进。