내 데이터를 구성 및 통합하기 위해 사용할 수 있는 단계

데이터 흐름의 다음 단계에 따라 데이터를 구성, 통합 및 변환할 수 있습니다. 예를 들어, 데이터 소스를 병합하거나, 데이터를 집계하거나, 지리 공간 분석을 수행할 수 있습니다.

단계를 통해 코딩 기술 없이도 시각적으로 데이터를 변환할 수 있습니다.

데이터 흐름 편집기를 사용하여 데이터 흐름에 단계를 추가합니다.
GUID-A3C23A5E-F96B-4EC3-9E7F-5917492D8368-default.png에 대한 설명이 이어집니다.
.png''

열 추가

대상 데이터 집합에 사용자정의 열을 추가합니다. 예를 들어, UNITS 열의 단위 수에 RETAIL_PRICE 열의 판매가를 곱해서(UNITS * RETAIL_PRICE) 재고 값을 계산할 수 있습니다.

데이터 추가

데이터 흐름에 데이터 소스를 추가합니다. 예를 들어, 두 개의 데이터 집합을 병합하려면 데이터 흐름에 두 데이터 집합을 추가합니다. 데이터베이스에서 데이터 흐름 지원을 참조하십시오.

집계

그룹 합계를 생성하고, 레코드 수를 세고, 값을 연결합니다. sum, count, sum, listagg를 예로 들 수 있습니다. 집계 함수를 참조하십시오.

감정 분석

제공된 텍스트 열에 대한 감정을 감지합니다(영어만). 예를 들어, 고객 피드백을 분석하여 피드백이 긍정적인지 아니면 부정적인지 확인할 수 있습니다. 감정 분석은 긍정적, 중립적, 부정적 감정을 나타내는 단어와 문구를 기반으로 텍스트를 평가합니다. 분석 결과에 따라 새 열에는 [긍정적], [중립적] 또는 [부정적]이 포함됩니다.

AI 모델 적용

인공 지능 모델을 사용하여 데이터를 분석합니다. 예를 들어, OCI Vision 서비스에서 생성된 모델을 사용하여 객체 감지, 이미지 분류 또는 텍스트 감지를 수행할 수 있습니다. Oracle Analytics에서 Oracle Cloud Infrastructure Vision 모델 사용을 참조하십시오. OCI Language 서비스에서 생성된 모델을 사용하여 감정 분석 및 언어 감지와 같은 언어 분석을 수행할 수도 있습니다.

모델 적용

Oracle Machine Learning 또는 OCI Data Science에서 머신 러닝 모델을 적용하여 데이터를 분석합니다. 예를 들어, 전자메일 스팸 여부를 예측할 분류 모델을 생성했을 수 있습니다. 예측 모델 또는 등록된 Oracle 머신 러닝 모델을 데이터 집합에 적용을 참조하십시오.

사용자정의 스크립트 적용

OCI(Oracle Cloud Infrastructure)에서 정의된 것과 같은 함수를 사용하여 데이터를 변환합니다. 예를 들어, 함수를 사용하여 영어 텍스트를 스페인어 또는 독일어로 변환할 수 있습니다. OCI 함수를 사용하여 데이터 변환을 참조하십시오.

AutoML

Oracle Autonomous AI Lakehouse의 AutoML 기능을 사용하여 예측 모델을 추천 및 학습할 수 있습니다. AutoML 단계는 데이터를 분석하고, 사용할 최상의 알고리즘을 계산하고, Oracle Analytics에서 예측 모델을 등록합니다. 분석은 Oracle Analytics가 아닌 데이터베이스에서 계산됩니다. 이 단계는 Oracle Autonomous AI Lakehouse를 기반으로 한 데이터 집합에 접속된 경우 단계 선택기에서 사용할 수 있습니다.

Oracle Autonomous AI Lakehouse에서 AutoML을 사용하여 예측 모델 학습을 참조하십시오.

자습서

Bin

데이터 값을 범주(예: 높음, 낮음 또는 중간)에 지정합니다. 예를 들어, 낮음, 중간, 높음의 세 가지 Bin으로 RISK에 대한 값을 범주화할 수 있습니다.

분기

데이터 흐름에서 다중 출력을 생성합니다. 예를 들어, 국가에 기반한 판매 거래 데이터가 있을 경우 첫번째 분기에 미국에 대한 데이터를 저장하고 두번째 분기에 캐나다에 대한 데이터를 저장할 수 있습니다.

누적 값

누적 합계(예: 이동 집계 또는 실행 집계)를 계산합니다.

데이터베이스 분석

고급 분석 및 데이터 마이닝 분석을 수행합니다. 예를 들어, 변형 감지, 데이터 클러스터화, 데이터 샘플링, 선호도 분석 수행이 가능합니다. 이 단계는 Oracle Database 또는 Oracle Autonomous AI Lakehouse를 기반으로 한 데이터 집합에 접속된 경우 단계 선택기에서 사용할 수 있습니다. 분석은 Oracle Analytics가 아닌 데이터베이스에서 계산됩니다. 데이터베이스 분석 함수를 참조하십시오.

필터

관심 있는 데이터만 선택합니다. 예를 들어, 2020년부터 2022년까지로 매출 데이터를 제한하는 필터를 생성할 수 있습니다.

그래프 분석

지리 공간 분석(예: 두 꼭지점 사이의 거리 또는 홉 수 계산)을 수행합니다. 이 단계는 Oracle Database 또는 Oracle Autonomous AI Lakehouse를 기반으로 한 데이터 집합에 접속된 경우 단계 선택기에서 사용할 수 있습니다. 분석은 Oracle Analytics가 아닌 데이터베이스에서 계산됩니다. 그래프 분석 함수를 참조하십시오.

그룹

비숫자 데이터를 정의한 그룹으로 범주화합니다. 예를 들어, Communication 및 Digital 사업 분야의 주문에 대해 Technology라는 그룹을 생성하고 Games 및 Stream 사업 분야의 주문에 대해 Entertainment라는 그룹을 생성할 수 있습니다.

조인

공통 열을 기반으로 데이터베이스 조인을 사용하여 다중 데이터 소스의 데이터를 결합합니다. 예를 들어, 고객 ID 필드를 사용하여 Orders 데이터 집합을 Customer_orders 데이터 집합에 조인할 수 있습니다.

병합

다중 열을 단일 열로 결합합니다. 예를 들어, 동/리 주소, 동/리 이름, 시/도 및 우편 번호 열을 하나의 열에 병합할 수 있습니다.

열 이름 바꾸기

열의 이름을 더 의미 있는 이름으로 변경합니다. 예를 들어, CELL을 담당자 휴대폰 번호로 변경할 수 있습니다.

열 재정렬

출력 데이터 집합에서 열 재정렬을 변경합니다. 예를 들어, 열 이름을 기반으로 영문자 순서에 따라 열을 정렬하거나 데이터 유형(문자, 정수 등)을 기반으로 열을 정렬하고자 할 수 있습니다.

데이터 저장

데이터 흐름으로 생성된 데이터를 저장할 위치를 지정합니다. Oracle Analytics 또는 데이터베이스에서 데이터 집합에 데이터를 저장할 수 있습니다. 또한 런타임 매개변수를 지정하거나 기본 데이터 집합 이름을 변경하고 출력 열에 대한 고유 설명을 추가할 수 있습니다. 데이터베이스에서 데이터 흐름 지원를 참조하십시오.

열 선택

데이터 흐름에서 포함 또는 제외할 열을 지정합니다. 기본값은 모든 데이터 열을 포함하는 것입니다.

열 분할

열 내에서 데이터를 추출합니다. 예를 들어, 열에 001011Black이 포함된 경우 이 데이터를 두 개의 별도 열인 001011과 Black으로 분할할 수 있습니다.

시계열 예측

과거 데이터를 기반으로 예측 값을 계산합니다. 예측은 주어진 데이터 집합에서 시간 열과 대상 열을 가져와서 대상 열에 대한 예측 값을 계산합니다.

<모델 유형> 학습

수치 예측, 다중 분류, 이진 분류 및 클러스터링을 위한 알고리즘을 사용하여 머신 러닝 모델을 학습합니다. 머신 러닝 모델 학습에 대한 데이터 흐름 단계를 참조하십시오.

머신 러닝 모델을 학습한 경우 모델 적용 단계를 사용하여 데이터에 적용합니다.

열 변환

데이터의 형식, 구조 또는 값을 변경합니다. 예를 들어, 텍스트를 대문자로 변환하거나 데이터에서 선행 및 후행 공백을 자르거나 값의 백분율 증가를 계산할 수 있습니다.

행 결합

두 데이터 소스의 행을 병합합니다(SQL 용어로 UNION 명령이라고 함). 순서 또는 이름을 기준으로 열을 일치시킬 수 있습니다.