Transformacja danych przy użyciu funkcji zastępowania

Dane w kolumnie można przekształcać, używając prostego uzgadniania opartego na wzorcu lub wyrażenia regularnego. Na przykład w kolumnie "Stan" można zmienić "CA" na "Kalifornia".

Można używać dowolnego wyrażenia regularnego zgodnego ze standardem PCRE (Perl Compatible Regular Expression). Transformacje są stosowane do każdego kwalifikującego się wiersza ze zbioru danych.
  1. Na stronie startowej wskazać kursorem zbiór danych będący własnością użytkownika, kliknąć Czynności i wybrać Otwórz.
    Jeśli zbiór danych zawiera jedną tabelę, zostanie wyświetlony edytor transformacji. Jeśli zbiór danych zawiera więcej niż jedną tabelę, zostanie wyświetlony "Diagram złączeń". W obszarze "Diagram złączeń" kliknąć prawym przyciskiem myszy źródło danych i kliknąć Otwórz, aby wyświetlić edytor transformacji.

  2. Umieścić wskaźnik myszy na kolumnie tekstu, która ma zostać przekształcona, lub wybrać tę kolumnę.
  3. Kliknąć Opcje u podstawy kafelka jakości, a następnie kliknąć Zastąp.
    Wskazówka: aby zastąpić więcej niż jedną wartość jednocześnie, należy użyć opcji Zastąp listę wartości.
  4. W edytorze etapu zastępowania określić sposób uzgadniania wartości. Na przykład:
    • Wybrać opcję Użyj wyrażenia regularnego, aby uzgadnianie było dokonywane za pomocą złożonego wyrażenia regularnego.
    • Wybrać opcję Uzgodnij tylko całe wartości aby zmienić "male" na "M", lecz nie zmieniać "female" na "feM".
  5. W polach Zastępowany napis i Nowy napis podać dosłowny tekst lub wyrażenie regularne, określające szukany i zastępujący tekst (jest uwzględniana wielkość liter).
    Przykłady:
    • Aby zmienić "2553 Bolman Court" na "2553 #Bolman# #Court#", wybrać opcję Użyj wyrażenia regularnego, wpisać w polu Zastępowany napis wyrażenie ([A-Za-z]+), a w polu Nowy napis - #$1#.
    • Aby zmienić "male" na "M", wybrać opcję Uzgodnij tylko całe wartości, wpisać w polu Zastępowany napis tekst male, a w polu Nowy napis wartość M. Nastąpi zmiana tekstu "male" na "M", lecz tekst "female" nie zostanie zmieniony na "feM".

    Gdy oba pola zostaną wypełnione, w okienku podglądu pojawi się podgląd przekształconych danych. Należy dostosowywać opcję zastępowania, aż w okienku podglądu zostanie uzyskana odpowiednia transformacja.
  6. Kliknąć przycisk Dodaj etap.
    Oracle Analytics dodaje etap do panelu "Skrypt przygotowawczy".
  7. Aby zapisać zmiany w przygotowaniu danych i zastosować dokonane zmiany do danych, nacisnąć przycisk Zapisz.

Przykłady zastępowania z użyciem wyrażeń regularnych

Przedstawiono tu kilka przykładów używania wyrażeń regularnych do przekształcania danych.

W tych przykładach, w "Wyrażenie wyszukiwania" jest pokazywane, co należy wprowadzić w polu Zastępowany napis, a w "Wartość zastępująca", co należy wprowadzić w polu Nowy napis.

Tabela 4-1 Przykłady zastępowania z użyciem wyrażeń regularnych

Wyrażenie wyszukiwania Wartość zastępująca Tekst oryginalny Tekst po zastąpieniu Uwagi
@([a-z]+)(?=\.[a-z]{3}) @example MichelePFalk@yahoo.com MichelePFalk@example.com Zastępowanie szczegółów domeny w adresie e-mail.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

Znaki ^$ zlecają wyszukiwanie całego napisu. Kreska pionowa stanowi w wyrażeniu regularnym operator OR - w tym przykładzie wyrażenie wyszukuje napisu "Gray" lub "Grey" i zastępuje go napisem "Silver".

Napis Graystone nie jest przekształcany, ponieważ wyrażenie regularne szuka jedynie całych zgodnych napisów.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

To wyrażenie regularne szuka jednej "\d" lub większej "+" liczby cyfr i zastępuje je cyframi "9999". Zastąpienie to działa także wtedy, gdy tekst oryginalny składa się tylko z trzech cyfr.
([A-z]+)(\d+) $2

UA101654

US829383

101654

829383

To wyrażenie regularne szuka jednej z następujących po sobie liter "[A-z]" lub większej "+" ich liczby, po których następuje jedna "\d" lub większa "+" liczba cyfr. Każde z tych dwóch wyrażeń jest ograniczone nawiasami, wyznaczającymi pierwszą grupę ([A-z]) i drugą grupę (\d+); grupy te są numerowane automatycznie i mogą być używane w tekście zastępującym przy użyciu znaku dolara dla drugiej grupy, na przykład "$2".
([A-z]+)(\d+) Kod pocztowy: $2

UA101654

US829383

Kod pocztowy: 101654

Kod pocztowy: 829383

W tym przykładzie jest używane to samo wyrażenie uzgadniające co poprzednim przykładzie, z tą różnicą, że przykład ten pokazuje, jak oprócz grupy wstawić swój własny tekst zastępujący. Tekst można wstawić przed lub po wywoływanej grupie uzgadniania.