Transformácia dát pomocou nahradenia

Transformujte dáta v stĺpci pomocou jednoduchej zhody vzoru alebo regulárneho výrazu (regex). Napríklad v stĺpci Štát môžete zmeniť hodnotu CA na hodnotu Kalifornia.

Môžete použiť ľubovoľný výraz PCRE (Perl Compatible Regular Expression), ktorý sa tiež označuje ako regulárny výraz. Transformácie sa používajú na každý použiteľný riadok v množine dát.
  1. Na domovskej stránke prejdite kurzorom na množinu dát, ktorú vlastníte, kliknite na ikonu Akcie a vyberte položku Otvoriť.
    Ak množina dát obsahuje jednu tabuľku, zobrazí sa editor transformácie. Ak množina dát obsahuje viac tabuliek, zobrazí sa Diagram spojenia. V zobrazení Diagram spojenia kliknite pravým tlačidlom myši na dátový zdroj a potom na položku Otvoriť. Zobrazí sa editor transformácie.

  2. Podržte kurzor nad textovým stĺpcom, ktorý chcete transformovať, alebo stĺpec vyberte.
  3. Kliknite na položku Voľby v spodnej časti dlaždice kvality a potom kliknite na položku Nahradiť.
    Tip: Ak chcete naraz nahradiť viacero hodnôt, použite voľbu Nahradiť zoznam hodnôt.
  4. V editore kroku Nahradiť zadajte, ako chcete priraďovať hodnoty. Príklad:
    • Kliknite na položku Použiť regulárny výraz na párovanie pomocou komplexného regulárneho výrazu (regex).
    • Kliknite na položku Párovať len celé hodnoty, aby sa výraz „muž“ zmenil na „M“.
  5. V poli Reťazec na nahradenie a v poli Nový reťazec zadajte doslovný text alebo regulárne výrazy na vyhľadanie a nahradenie (rozlišujú sa veľké a malé písmená).
    Príklady:
    • Ak chcete zmeniť hodnotu „2553 Bolman Court“ na „2553 #Bolman# #Court#“, vyberte možnosť Použiť regulárny výraz, zadajte hodnotu ([A-Za-z]+) do poľa Reťazec na nahradenie a zadajte hodnotu #$1# do poľa Nový reťazec.
    • Ak chcete zmeniť hodnotu „muž“ na „M“, vyberte možnosť Párovať len celé hodnoty, zadajte hodnotu muž do poľa Reťazec na nahradenie a zadajte hodnotu M do poľa Nový reťazec. Tým sa hodnota „muž“ zmení na „M“.

    Po vyplnení oboch polí sa ukážka transformovaných dát zobrazí v podokne ukážky. Upravte voľby nahradenia tak, aby ste v podokne ukážky získali želanú transformáciu.
  6. Kliknite na položku Pridať krok.
    Služba Oracle Analytics pridá krok na panel Skript prípravy.
  7. Ak chcete uložiť zmeny prípravy dát a použiť ich v dátach, kliknite na tlačidlo Uložiť.

Príklad transformácií nahradenia pomocou regulárnych výrazov

V tejto časti nájdete niekoľko príkladov použitia regulárnych výrazov (regex) na transformáciu dát.

V týchto príkladoch sa v stĺpci Hľadaný výraz zobrazuje, čo zadať do poľa Reťazec na nahradenie, a stĺpec Náhradná hodnota zobrazuje, čo zadať do poľa Nový reťazec.

Tabuľka 4-1 Príklad transformácií nahradenia

Hľadaný výraz Náhradná hodnota Pôvodný text Nahradený text Poznámky
@([a-z]+)(?=\.[a-z]{3}) @example MichelePFalk@yahoo.com MichelePFalk@example.com V tomto príklade sa nahradia detaily domény v e-mailových adresách.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

Znaky ^$ znamenajú len vyhľadávanie úplne sa zhodujúcich reťazcov. Zvislý pruh je regulárny výraz pre operátor OR, takže v tomto prípade regulárny výraz vyhľadáva reťazce Gray alebo Grey a nahrádza ich reťazcom Silver.

Reťazec Graystone sa netransformuje, pretože regulárny výraz vyhľadáva len úplne sa zhodujúce reťazce.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

Tento regulárny výraz vyhľadáva jeden reťazec \d alebo viaceré číslice + a nahradí ich reťazcom 9999. Nahradenie funguje aj v prípade, že pôvodný text obsahuje len tri číslice.
([A-z]+)(\d+) $2

UA101654

US829383

101654

829383

Tento regulárny výraz vyhľadáva jeden znak [A-z] alebo viaceré za sebou nasledujúce znaky +, za ktorými nasleduje jeden znak \d alebo viaceré číslice +. Každý z dvoch výrazov je ohraničený zátvorkami, ktoré uzatvárajú dve skupiny - prvú ([A-z]) a druhú (\d+) - tieto skupiny sú automaticky číslované a potom sa môžu použiť pri náhrade použitím znaku dolára pre druhú skupinu, napríklad $2.
([A-z]+)(\d+) PSČ: $2

UA101654

US829383

PSČ: 101654

PSČ: 829383

V tomto príklade sa používa rovnaký výraz zhody ako v predchádzajúcom prípade, s tým rozdielom, že ukazuje, ako vložiť vlastný náhradný text okrem skupiny. Text môže byť vložený pred a za odvolanú skupinu zhody.