바꾸기를 사용하여 데이터 변환

단순 패턴 일치 또는 정규 표현식을 사용하여 열에서 데이터를 변환합니다. 예를 들어, State 열에서는 CA를 California로 변경할 수 있습니다.

정규 표현식이라고도 하는 PCRE(Perl Compatible Regular Expression)를 사용할 수 있습니다. 변환은 데이터 집합의 적용 가능한 모든 행에 적용됩니다.
  1. 홈 페이지에서 데이터 집합 또는 워크북을 엽니다.
    • 데이터 집합 위로 커서를 가져가서 작업을 누른 다음 열기를 선택합니다. 데이터 다이어그램 또는 조인 다이어그램에서 데이터 소스를 마우스 오른쪽 단추로 누르고 열기를 눌러 변환 편집기를 표시합니다.
    • 데이터 집합을 포함하는 워크북 위로 커서를 가져가서 작업을 누른 다음 열기를 선택하고 데이터를 누릅니다. 데이터 다이어그램 또는 조인 다이어그램에서 데이터 소스를 마우스 오른쪽 단추로 누르고 열기를 눌러 변환 편집기를 표시합니다.

    주:

    Oracle Analytics는 단일 테이블 데이터 집합용 데이터 다이어그램 또는 다중 테이블 데이터 집합용 조인 다이어그램을 표시합니다.
  2. 변환할 텍스트 열을 커서로 가리키거나 선택합니다.
  3. 품질 타일 하단에 있는 옵션을 누른 후 바꾸기를 누릅니다.
    : 두 개 이상의 값을 동시에 바꾸려면 값 목록 바꾸기 옵션을 사용하십시오.
  4. 바꾸기 단계 편집기에서 값 일치 방법을 지정합니다. 예를 들어, 다음과 같습니다.
    • 정규 표현식 사용을 눌러 복합 정규 표현식을 사용하여 일치시킵니다.
    • 전체 값만 일치를 눌러 "male"을 "M"으로 변경하지만 "female"은 "feM"으로 변경하지 않습니다.
  5. 바꿀 문자열 필드 및 새 문자열 필드에서 검색 및 바꾸기를 수행할 리터럴 텍스트 또는 정규 표현식을 지정합니다(대소문자 구분).
    예제:
    • "2553 Bolman Court"를 "2553 #Bolman# #Court#"로 변경하려면 정규 표현식 사용을 선택하고 바꿀 문자열 필드에서 ([A-Za-z]+)를 입력한 다음 새 문자열 필드에서 #$1#을 입력합니다.
    • "male"을 "M"으로 변경하려면 전체 값만 일치를 선택하고 바꿀 문자열 필드에서 male을 입력한 다음 새 문자열 필드에서 M을 입력합니다. 이는 "male"을 "M"으로 변경하지만 "female"은 "feM"으로 변경하지 않습니다.

    두 필드가 완료되면 미리보기 창에서 변환된 데이터의 미리보기가 표시됩니다. 미리보기 창에서 원하는 변환을 얻을 때까지 바꾸기 옵션을 조정합니다.
  6. 단계 추가를 누릅니다.
    Oracle Analytics가 준비 스크립트 패널에 단계를 추가합니다.
  7. 데이터 준비 변경사항을 저장하여 데이터에 적용하려면 저장을 누릅니다.

정규 표현식을 사용한 바꾸기 변환 예

다음은 정규 표현식을 사용하여 데이터를 변환하는 몇 가지 예입니다.

다음 예에서 검색 표현식은 바꿀 문자열 필드에 입력할 텍스트를 보여주며, 값 바꾸기는 새 문자열 필드에 입력할 텍스트를 보여줍니다.

표 3-1 바꾸기 변환 예

검색 표현식 값 바꾸기 원래 텍스트 바뀐 텍스트
@([a-z]+)(?=\.[a-z]{3}) @example MichelePFalk@yahoo.com MichelePFalk@example.com 이 예에서는 전자메일 주소의 도메인 세부정보를 바꿉니다.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

^$ 문자는 전체 문자열 일치 항목만 찾음을 의미합니다. 세로 막대는 OR에 해당하는 정규 표현식입니다. 따라서 이 예에서는 정규 표현식이 "Gray" 또는 "Grey"를 찾아 "Silver"로 바꿉니다.

정규 표현식이 전체 값 일치 항목만 찾으므로 Graystone 문자열은 변환되지 않습니다.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

이 정규 표현식은 하나의 "\d" 또는 "+" 초과 자릿수를 찾아 "9999"로 바꿉니다. 원래 텍스트가 세 자리뿐인 경우도 바꾸기가 동작합니다.
([A-z]+)(\d+) $2

UA101654

US829383

101654

829383

이 정규 표현식은 하나의 "[A-z]" 또는 "+" 초과 연속 문자와 그 뒤에 오는 하나의 "\d" 또는 "+" 초과 자릿수를 찾습니다. 두 표현식은 각각 괄호로 묶여 있으며 두 개의 그룹, 즉 첫번째 그룹([A-z])과 두번째 그룹(\d+)을 캡처합니다. 해당 그룹에는 자동으로 번호가 지정되므로 두번째 그룹에 달러 기호를 사용하여 대체에 사용할 수 있습니다(예: "$2").
([A-z]+)(\d+) Postal Code: $2

UA101654

US829383

Postal Code: 101654

Postal Code: 829383

그룹과 함께 고유의 바꾸기 텍스트를 삽입하는 방법을 보여준다는 점을 제외하면, 이 예에서는 이전 예와 동일한 일치 표현식을 사용합니다. 텍스트는 회수된 일치 그룹의 앞과 뒤에 삽입할 수 있습니다.