데이터 흐름의 다음 단계에 따라 데이터를 구성, 통합 및 변환할 수 있습니다. 예를 들어, 데이터 소스를 병합하거나, 데이터를 집계하거나, 지리 공간 분석을 수행할 수 있습니다.
단계를 통해 코딩 기술 없이도 시각적으로 데이터를 변환할 수 있습니다.
데이터 흐름 편집기를 사용하여 데이터 흐름에 단계를 추가합니다.
.png''
열 추가
대상 데이터 집합에 사용자정의 열을 추가합니다. 예를 들어, UNITS
열의 단위 수에 RETAIL_PRICE
열의 판매가를 곱해서(UNITS
* RETAIL_PRICE
) 재고 값을 계산할 수 있습니다.
데이터 추가
데이터 흐름에 데이터 소스를 추가합니다. 예를 들어, 두 개의 데이터 집합을 병합하려면 데이터 흐름에 두 데이터 집합을 추가합니다. 데이터베이스에서 데이터 흐름 지원을(를) 참조하십시오.
집계
집계 함수를 적용하여 그룹 합계를 생성합니다. 예를 들어, count, sum 또는 average를 사용할 수 있습니다.
감정 분석
제공된 텍스트 열에 대한 감정을 감지합니다(영어만). 예를 들어, 고객 피드백을 분석하여 피드백이 긍정적인지 아니면 부정적인지 확인할 수 있습니다. 감정 분석은 긍정적, 중립적, 부정적 감정을 나타내는 단어와 문구를 기반으로 텍스트를 평가합니다. 분석 결과에 따라 새 열에는 [긍정적], [중립적] 또는 [부정적]이 포함됩니다.
모델 적용
Oracle Machine Learning 또는 OCI Data Science에서 머신 러닝 모델을 적용하여 데이터를 분석합니다. 예를 들어, 전자메일 스팸 여부를 예측할 분류 모델을 생성했을 수 있습니다. 예측 모델 또는 등록된 Oracle 머신 러닝 모델을 데이터 집합에 적용을(를) 참조하십시오.
AutoML
Oracle 자율운영 데이터 웨어하우스(ADW)의 AutoML 기능을 사용하여 예측 모델을 추천 및 학습할 수 있습니다. AutoML 단계는 데이터를 분석하고, 사용할 최상의 알고리즘을 계산하고, Oracle Analytics에서 예측 모델을 등록합니다. 분석은 Oracle Analytics가 아닌 데이터베이스에서 계산됩니다. 이 단계는 Oracle 자율운영 데이터 웨어하우스(ADW)를 기반으로 한 데이터 집합에 접속된 경우 단계 선택기에서 사용할 수 있습니다.
Bin
데이터 값을 범주(예: 높음, 낮음 또는 중간)에 지정합니다. 예를 들어, 낮음, 중간, 높음의 세 가지 Bin으로 RISK
에 대한 값을 범주화할 수 있습니다.
분기
데이터 흐름에서 다중 출력을 생성합니다. 예를 들어, 국가에 기반한 판매 거래 데이터가 있을 경우 첫번째 분기에 미국에 대한 데이터를 저장하고 두번째 분기에 캐나다에 대한 데이터를 저장할 수 있습니다.
Essbase 큐브 생성
스프레드시트 또는 데이터베이스에서 Essbase 큐브를 생성합니다.
누적 값
누적 합계(예: 이동 집계 또는 실행 집계)를 계산합니다.
데이터베이스 분석
고급 분석 및 데이터 마이닝 분석을 수행합니다. 예를 들어, 변형 감지, 데이터 클러스터화, 데이터 샘플링, 선호도 분석 수행이 가능합니다. 이 단계는 Oracle 데이터베이스 또는 Oracle 자율운영 데이터 웨어하우스(ADW)를 기반으로 한 데이터 집합에 접속된 경우 단계 선택기에서 사용할 수 있습니다. 분석은 Oracle Analytics가 아닌 데이터베이스에서 계산됩니다. 데이터베이스 분석 함수을(를) 참조하십시오.
필터
관심 있는 데이터만 선택합니다. 예를 들어, 2020년부터 2022년까지로 매출 데이터를 제한하는 필터를 생성할 수 있습니다.
그래프 분석
지리 공간 분석(예: 두 꼭지점 사이의 거리 또는 홉 수 계산)을 수행합니다. 이 단계는 Oracle 데이터베이스 또는 Oracle 자율운영 데이터 웨어하우스(ADW)를 기반으로 한 데이터 집합에 접속된 경우 단계 선택기에서 사용할 수 있습니다. 분석은 Oracle Analytics가 아닌 데이터베이스에서 계산됩니다. 그래프 분석 함수을(를) 참조하십시오.
그룹
비숫자 데이터를 정의한 그룹으로 범주화합니다. 예를 들어, 사업 분야 Communication
및 Digital
에 대한 주문을 Technology
라는 그룹에 넣고 Games
및 Stream
에 대한 주문을 Entertainment
라는 그룹에 넣을 수 있습니다.
조인
공통 열을 기반으로 데이터베이스 조인을 사용하여 다중 데이터 소스의 데이터를 결합합니다. 예를 들어, 고객 ID 필드를 사용하여 Orders
데이터 집합을 Customer_orders
데이터 집합에 조인할 수 있습니다.
병합
다중 열을 단일 열로 결합합니다. 예를 들어, 동/리 주소, 동/리 이름, 시/도 및 우편 번호 열을 하나의 열에 병합할 수 있습니다.
열 이름 바꾸기
열의 이름을 더 의미 있는 이름으로 변경합니다. 예를 들어, CELL을 담당자 휴대폰 번호로 변경할 수 있습니다.
열 재정렬
출력 데이터 집합에서 열 재정렬을 변경합니다. 예를 들어, 열 이름을 기반으로 영문자 순서에 따라 열을 정렬하거나 데이터 유형(문자, 정수 등)을 기반으로 열을 정렬하고자 할 수 있습니다.
데이터 저장
데이터 흐름으로 생성된 데이터를 저장할 위치를 지정합니다. Oracle Analytics 또는 데이터베이스에서 데이터 집합에 데이터를 저장할 수 있습니다. 또한 런타임 매개변수를 지정하거나 기본 데이터 집합 이름을 변경할 수 있습니다. 데이터베이스에서 데이터 흐름 지원을(를) 참조하십시오.
열 선택
데이터 흐름에서 포함 또는 제외할 열을 지정합니다. 기본값은 모든 데이터 열을 포함하는 것입니다.
열 분할
열 내에서 데이터를 추출합니다. 예를 들어, 열에 001011Black
이 포함된 경우 이 데이터를 두 개의 별도 열인 001011
과 Black
으로 분할할 수 있습니다.
시계열 예측
과거 데이터를 기반으로 예측 값을 계산합니다. 예측은 주어진 데이터 집합에서 시간 열과 대상 열을 가져와서 대상 열에 대한 예측 값을 계산합니다.
<모델 유형> 학습
수치 예측, 다중 분류, 이진 분류 및 클러스터링을 위한 알고리즘을 사용하여 머신 러닝 모델을 학습합니다. 머신 러닝 모델 학습에 대한 데이터 흐름 단계을(를) 참조하십시오.
머신 러닝 모델을 학습한 경우 모델 적용 단계를 사용하여 데이터에 적용합니다.
열 변환
데이터의 형식, 구조 또는 값을 변경합니다. 예를 들어, 텍스트를 대문자로 변환하거나 데이터에서 선행 및 후행 공백을 자르거나 값의 백분율 증가를 계산할 수 있습니다.
행 결합
두 데이터 소스의 행을 병합합니다(SQL 용어로 UNION 명령이라고 함). 순서 또는 이름을 기준으로 열을 일치시킬 수 있습니다.