ラージ・ファイルの処理中の列または行数の合計の計算
ステージ・ファイル・アクションのセグメント内のファイルの読取り操作を使用して、大きなカンマ区切り値(CSV)ファイル(最大1 GB)を処理できます。 列の合計または行数の計算が必要な場合もあります。
次のペイロードについて考えてみます。 列Amount1のすべての値の合計を計算するとします。 通常、ステージ・ファイル・アクションの上位変数を宣言し、ステージ・ファイル・アクションの各チャンクで行われる計算でこの変数を更新しておくことができます。


ただし、ステージ・ファイル・アクション・セグメント内のファイルの読取り操作内の上流変数の更新はパフォーマンスに影響し、ステージ・ファイル・アクションをパラレルに処理することはできません。 統合キャンバスで次の警告メッセージが表示されます:
Stage File Read File in Segments includes action that will result in segments being processed sequentiallyこのユースケースの解決策として、次のステップを実行して、大規模なファイルの処理中に集計関数sumおよび「カウント」を使用します:




