データ・フローの増分処理の構成
増分処理を構成して、データベースから新規または更新済レコードのみをロードします。データ・セットが(データベース接続を使用して)データベースをソースとする場合に、増分処理をデプロイできます。
開始する前に、Oracle、Oracle Autonomous Data Warehouse、Apache Hive、Hortonworks HiveまたはMap R Hiveなどのサポートされているターゲット・データベースのいずれかへの接続を作成します。
- ソース・データ・セットの増分識別子を指定します。
- ホーム・ページで、「ナビゲータ」をクリックしてから「データ」をクリックします。
- データ・セットを選択し、「アクション」メニューをクリックするか右クリックして、「開く」を選択します。
- 結合ダイアグラムで、使用する増分識別子を含む表をダブルクリックします。
- ツールバーで「定義の編集」をクリックします。
- 「新規データ・インジケータ」リストから、新規データを追加したときに検出する列を選択します。
- 「OK」をクリックします。
- データ・フローで使用される出力データ接続に増分処理を適用します。
- 増分処理を適用するデータ・フローを作成するか開きます。
- データ・フロー・エディタで「データの保存」ステップを選択して、「ステップ・エディタ」ペインを表示します。
- 「データ・セット」フィールドで、入力データ・セットの名前を指定します(「データの追加」ステップで指定されたデータ・セット)。
- 「データ保存先」オプションで「データベース接続」を選択します。
- 「接続の選択」をクリックして、サポートされているターゲット・データベースのいずれかへの接続を選択します。
- 「データ」フィールドで、書き込むターゲットの名前を指定します。
- 「実行時」オプションで、「既存データへの新規データの追加」を選択します。
- 「保存」をクリックします。
これで、データ・フローをスケジュールして新規データを定期的にロードする準備ができました。