古いコードには、古いベクトル化コンパイラに特定のアーキテクチャーに最適なコードを生成させるための、通常の計算の DO ループを再構成しているソースコードが含まれていることがあります。ほとんどの場合、この再構成は必要がないもので、しかもプログラムの移植性を下げます。よく使用される再構成は、Strip-mining (ストリップマイニング) とループの展開の 2 つです。
いくつかのアーキテクチャー上では、固定長のベクトルレジスタのために、プログラマは手作業でループ内の配列計算について、セグメントの中にストリップマイニングをしなければいけませんでした。
REAL TX(0:63)
...
DO IOUTER = 1,NX,64
DO IINNER = 0,63
TX(IINNER) = AX(IOUTER+IINNER) * BX(IOUTER+IINNER)/2.
QX(IOUTER+IINNER) = TX(IINNER)**2
END DO
END DO
|
ストリップマイニングは最近のコンパイラには適切でありません。このループは、次のようにより明瞭に書くことができます。
DO IX = 1,N
TX = AX(I)*BX(I)/2.
QX(I) = TX**2
END DO
|
以前、手作業によるループの展開はソースコード最適化のための典型的なテクニックでした。しかし、現在はコンパイラがこの再構成を自動的に行います。次にループの例を示します。
DO K = 1, N-5, 6
DO J = 1, N
DO I = 1,N
A(I,J) = A(I,J) + B(I,K ) * C(K ,J)
* + B(I,K+1) * C(K+1,J)
* + B(I,K+2) * C(K+2,J)
* + B(I,K+3) * C(K+3,J)
* + B(I,K+4) * C(K+4,J)
* + B(I,K+5) * C(K+5,J)
END DO
END DO
END DO
DO KK = K,N
DO J =1,N
DO I =1,N
A(I,J) = A(I,J) + B(I,KK) * C(KK,J)
END DO
END DO
END DO
|
前述のループは、本来意図していたとおり、次のように書き換えるべきです。
DO K = 1,N
DO J = 1,N
DO I = 1,N
A(I,J) = A(I,J) + B(I,K) * C(K,J)
END DO
END DO
END DO
|