데이터 흐름 정보

데이터 흐름을 사용하면 데이터를 구성 및 통합하여 사용자가 시각화할 수 있는 검토된 데이터 집합을 생성할 수 있습니다.

데이터 흐름을 사용하여 수동 코딩 기술 없이도 시각적으로 데이터를 조작할 수 있습니다.

예를 들어, 데이터 흐름을 사용하여 다음 작업을 수행할 수 있습니다.

  • 데이터 집합을 생성합니다.
  • 다양한 소스의 데이터를 결합합니다.
  • 데이터를 집계합니다.
  • 머신 러닝 모델을 학습하거나 데이터에 예측 머신 러닝 모델을 적용합니다.
  • OCI Vision 서비스를 통해 인공 지능을 사용하여 객체 감지, 이미지 분류 또는 텍스트 감지를 수행합니다.

데이터 흐름 설계 창에서 데이터 흐름을 생성합니다.
GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png에 대한 설명이 이어집니다.
.png''

데이터 흐름을 빌드하려면 단계를 추가합니다. 각 단계는 특정 기능(예: 데이터 추가, 테이블 조인, 열 병합 또는 데이터 변환)을 수행합니다. 데이터 흐름 편집기를 사용하여 단계를 추가하고 구성합니다. 단계를 추가 또는 변경할 때마다 단계가 검증됩니다. 데이터 흐름을 구성한 경우 실행하여 데이터 집합을 생성 또는 업데이트합니다.

고유의 열을 추가하거나 데이터를 변환하면 광범위한 SQL 연산자(예: BETWEEN, LIKE, IN), 조건부 표현식(예: CASE), 함수(예: 평균, 중간값, 백분위수)를 사용할 수 있습니다.

데이터 흐름에 의해 생성된 데이터 집합 업데이트

데이터 흐름을 재실행하여 데이터 집합을 최신 상태로 유지할 수 있습니다.

주:

데이터 흐름을 재실행하면 데이터 흐름 외부의 출력 데이터 집합에 직접 적용된 모든 변환이 손실됩니다. 데이터 집합은 처음부터 재생성됩니다.

데이터베이스에서 데이터 흐름 지원

데이터 흐름을 사용하여 데이터 집합, 주제 영역 또는 데이터베이스 접속을 기반으로 데이터를 검토할 수 있습니다.

데이터 흐름을 개별적으로 또는 순차적으로 실행할 수 있습니다. 데이터 흐름에 여러 데이터 소스를 포함하고 조인 방법을 지정할 수 있습니다.

데이터 흐름에 데이터를 추가하려면 데이터 추가 단계를 사용하고, 데이터 흐름의 출력 데이터를 저장하려면 데이터 저장 단계를 사용합니다.

데이터 집합 또는 지원되는 데이터베이스 유형 중 하나로 데이터 흐름에서 출력 데이터를 저장할 수 있습니다. 데이터베이스에 데이터를 저장하면 데이터 소스를 데이터 흐름의 데이터로 겹쳐써서 데이터 소스를 변환할 수 있습니다. 데이터 소스와 데이터 흐름 테이블은 동일한 데이터베이스에 있어야 하며 동일한 이름을 사용해야 합니다. 시작하기 전에 지원되는 데이터베이스 유형 중 하나에 대한 접속을 생성하십시오.

주:

데이터 게이트웨이와 접속된 원격 데이터베이스에서 데이터를 추가할 수 있습니다. 그러나 데이터 게이트웨이와 접속된 원격 데이터베이스로 다시 데이터를 저장할 수는 없습니다.

데이터 출력

다음 데이터베이스 유형에 데이터 흐름의 출력 데이터를 저장할 수 있습니다.
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

데이터베이스 버전 정보는 지원되는 데이터 소스을(를) 참조하십시오.

데이터 입력

대부분의 데이터베이스 유형(Oracle Essbase 및 EPM Cloud 제외)에서 데이터 흐름에 데이터를 입력할 수 있습니다.