데이터 흐름 정보

데이터 흐름을 사용하면 데이터를 구성 및 통합하여 사용자가 시각화할 수 있는 검토된 데이터 집합을 생성할 수 있습니다.

데이터 흐름을 사용하여 수동 코딩 기술 없이도 시각적으로 데이터를 조작할 수 있습니다.

예를 들어, 데이터 흐름을 사용하여 다음 작업을 수행할 수 있습니다.

데이터 집합을 생성합니다.

다양한 소스의 데이터를 결합합니다.
데이터를 집계합니다.
머신 러닝 모델을 학습하거나 데이터에 예측 머신 러닝 모델을 적용합니다.
OCI Vision 서비스를 통해 인공 지능을 사용하여 객체 감지, 이미지 분류 또는 텍스트 감지를 수행합니다.

데이터 흐름 설계 창에서 데이터 흐름을 생성합니다.
GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png에 대한 설명이 이어집니다.
.png''

데이터 흐름을 빌드하려면 단계를 추가합니다. 각 단계는 특정 기능(예: 데이터 추가, 테이블 조인, 열 병합 또는 데이터 변환)을 수행합니다. 데이터 흐름 편집기를 사용하여 단계를 추가하고 구성합니다. 단계를 추가 또는 변경할 때마다 단계가 검증됩니다. 데이터 흐름을 구성한 경우 실행하여 데이터 집합을 생성 또는 업데이트합니다.

고유의 열을 추가하거나 데이터를 변환하면 광범위한 SQL 연산자(예: BETWEEN, LIKE, IN), 조건부 표현식(예: CASE), 함수(예: 평균, 중간값, 백분위수)를 사용할 수 있습니다.

데이터 흐름에 의해 생성된 데이터 집합 업데이트

데이터 흐름을 재실행하여 데이터 집합을 최신 상태로 유지할 수 있습니다.

주:

데이터 흐름을 재실행하면 데이터 흐름 외부의 출력 데이터 집합에 직접 적용된 모든 변환이 손실됩니다. 데이터 집합은 처음부터 재생성됩니다.

데이터 흐름 제한

대량의 데이터를 처리하는 경우 데이터 흐름 제한이 있습니다. 데이터 흐름 제한을 참조하십시오.

데이터베이스에서 데이터 흐름 지원

데이터 흐름을 사용하여 데이터 집합 및 주제 영역으로부터 데이터를 선별할 수 있습니다.

데이터 흐름을 개별적으로 또는 순차적으로 실행할 수 있습니다. 데이터 흐름에 여러 데이터 소스를 포함하고 조인 방법을 지정할 수 있습니다.

데이터 흐름에 데이터를 추가하려면 데이터 추가 단계를 사용하고, 데이터 흐름의 출력 데이터를 저장하려면 데이터 저장 단계를 사용합니다.

데이터 집합 또는 지원되는 데이터베이스 유형 중 하나로 데이터 흐름에서 출력 데이터를 저장할 수 있습니다. 데이터베이스에 데이터를 저장하면 데이터 소스를 데이터 흐름의 데이터로 겹쳐써서 데이터 소스를 변환할 수 있습니다. 데이터 소스와 데이터 흐름 테이블은 동일한 데이터베이스에 있어야 하며 동일한 이름을 사용해야 합니다. 시작하기 전에 지원되는 데이터베이스 유형 중 하나에 대한 접속을 생성하십시오.

주:

데이터 게이트웨이와 접속된 원격 데이터베이스에서 데이터를 추가할 수 있습니다. 그러나 데이터 게이트웨이와 접속된 원격 데이터베이스로 다시 데이터를 저장할 수는 없습니다.

데이터 출력

다음 데이터베이스 유형에 데이터 흐름의 출력 데이터를 저장할 수 있습니다.

Oracle Autonomous AI Lakehouse
Oracle Autonomous AI Transaction Processing
Oracle Database
Apache Hive
Hortonworks Hive
MapR Hive
Spark

데이터베이스 버전 정보는 지원되는 데이터 소스를 참조하십시오.

데이터 입력

데이터 흐름에서 데이터 집합 및 주제 영역의 데이터를 처리할 수 있습니다. 데이터베이스에서 직접 데이터를 풀링할 수 없습니다. 먼저 데이터베이스 테이블에서 데이터 집합을 생성해야 합니다.

데이터 흐름 디자이너에서 작업

데이터 흐름 디자이너를 사용하면 그래픽 디자인 환경에서 데이터를 선별하고 변환할 수 있습니다.

데이터 흐름 디자이너에서 작업:

데이터 흐름 디자이너를 사용하여 데이터를 변환하는 데이터 흐름 단계를 정리 및 구성합니다.

GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png에 대한 설명이 이어집니다.

.png''

데이터 흐름 디자이너에서 다음 기능을 사용할 수 있습니다.

기능	아이콘	설명
축소 레이아웃		단계를 더 작은 뷰 영역으로 그룹화하여 스크롤을 줄입니다.
확장된 레이아웃		가독성 향상을 위해 입력 데이터 소스 단계를 왼쪽에 맞춥니다.
불완전한 조인 또는 결합		조인 또는 결합되지 않은 데이터 소스를 나타냅니다. 파란색 링크 아이콘 위로 커서를 가져가서 제안되는 조인 대상(점선)을 확인하고 다시 눌러서 조인 또는 결합(실선)을 완료합니다. 접속을 제거하려면 조인 단계 또는 결합 단계 을 마우스 오른쪽 단추로 누른 다음 삭제를 선택합니다.
확대/축소 향상된 기능		확대/축소합니다.