データ・フローで増分処理を適用して、データベースから新規または更新済レコードのみをロードします。
データ・フローで増分処理を適用すると、非効率でコストの高いフル・ロードを毎回実行するのではなく、新しいデータのみをロードできます。つまり、データ・フローを使用してデータをロードするたびに、前回実行時以降に追加された新しいデータのみが処理されます。
開始する前に、Oracle、Oracle Autonomous Data Warehouse、Apache Hive、Hortonworks HiveまたはMap R Hiveなどのサポートされているデータベースのいずれかへの接続を作成します。次に、そのデータベースの新しいデータ・インジケータを構成します。
データ・ソースの新規データ・インジケータの指定を参照してください。
- 増分処理を適用するデータ・フローを作成するか、開きます。
- データ・フロー・エディタで「データの保存」ステップを選択して、「ステップ・エディタ」ペインを表示します。
- 「データセット」フィールドで、「データの追加」ステップで指定した入力データセットの名前を指定します。
- 「データ保存先」オプションで「データベース接続」を選択します。
- 「接続の選択」をクリックして、サポートされているターゲット・データベースのいずれかへの接続を選択します。
- 「表」フィールドで、書き込み先のターゲット表の名前を指定します。
- 「実行時」オプションで、「既存データへの新規データの追加」を選択します。
- 「保存」をクリックします。