データ・ソースの新規データ・インジケータの指定

データ・ソースで新規データ・インジケータとして使用するデータ列を選択します。このインジケータにより、データ・フローが最後に実行された後、いつ新しいデータを検出するかが決定されます。たとえば、タイムスタンプ列を選択します。

新規データ・インジケータを指定すると、データのロード時に増分処理を実行できます。つまり、データ・フローを使用してデータをロードするたびに、前回実行時以降に追加された新しいデータのみが処理されます。
開始する前に、Oracle、Oracle Autonomous Data Warehouse、Apache Hive、Hortonworks HiveまたはMap R Hiveなどのサポートされているデータベースのいずれかへの接続を作成します。
  1. ホーム・ページで、「ナビゲータ」をクリックしてから「データ」をクリックします
  2. データセットにカーソルを合せ、「アクション」をクリックして「開く」を選択します。
  3. 結合ダイアグラムで、使用する増分識別子を含む表をダブルクリックします。
  4. 「定義の編集」をクリックします。
  5. データ・アクセス・パネルが表示されていない場合は、ウィンドウの右端中央に移動し、「展開」オプションを探して、「展開」をクリックします。

    これで、キャッシュ・オプションと、「拡張」の下に「フローの新規データ・インジケータ」が表示されます。
    GUID-B895C974-E71A-43DE-BC01-CB0698F8BDF2-default.pngの説明が続きます
    .pngの説明

  6. 「フローの新規データ・インジケータ」フィールドで、新規データが追加されたときに検出する列を選択します。
  7. 「OK」をクリックします。