증분 처리를 위한 데이터 흐름 구성

데이터베이스에서 새 레코드 또는 업데이트된 레코드만 로드되도록 증분 처리를 적용합니다.

데이터 흐름에 증분 처리를 적용하면 비효율적이고 고비용의 전체 로드를 매번 수행하는 대신, 새 데이터만 로드할 수 있습니다. 다시 말해서, 데이터 흐름을 사용하여 데이터를 로드할 때마다 마지막 실행 이후 추가된 새 데이터만 처리하면 됩니다.
시작하기 전에 지원되는 데이터베이스(예: Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive 또는 Map R Hive) 중 하나에 대한 접속을 생성합니다. 그런 다음 해당 데이터베이스에 대한 새 데이터 표시기를 구성합니다. 데이터 소스에 대한 새 데이터 표시기 지정을(를) 참조하십시오.
  1. 증분 처리를 적용할 데이터 흐름을 생성하거나 엽니다.
  2. 데이터 흐름 편집기에서 데이터 저장 단계를 선택하여 단계 편집기 창을 표시합니다.
  3. 데이터 집합 필드에서 데이터 추가 단계에 지정된 입력 데이터 집합의 이름을 지정합니다.
  4. 데이터 저장 위치 옵션에서 데이터베이스 접속을 선택합니다.
  5. 접속 선택을 누르고 지원되는 대상 데이터베이스 중 하나에 대한 접속을 선택합니다.
  6. 테이블 필드에서 작성 중인 대상 테이블의 이름을 지정합니다.
  7. 실행할 때 옵션에서 기존 데이터에 새 데이터 추가를 선택합니다.
  8. 저장을 누릅니다.