Transformacija putem zamjene

Transformirajte podatke u stupcu putem jednostavnog usklađivanja uzorka ili regularnog (regex) izraza. Na primjer, u stupcu State CA možete promijeniti u California.

Upotrijebiti možete sve regularne izraze kompatibilne s jezikom Perl (PCRE). Takvi izrazi nazivaju se i regex izrazima. Transformacije će se primijeniti na sve odgovarajuće retke u skupu podataka.
  1. Na početnoj stranici zadržite pokazivač iznad skupa podataka koji posjedujete i, pritisnite Akcije i odaberite Otvori.
    Ako skup podataka sadrži jednu tablicu, vidjet ćete uređivač za transformaciju. Ako skup podataka sadrži više tablica, vidjet ćete Dijagram spojeva. U Dijagramu spojeva desnom tipkom miša pritisnite izvor podataka i pritisnite Otvori za prikaz uređivača za transformaciju.

  2. Zadržite pokazivač miša ili odaberite stupac s tekstom koji želite transformirati.
  3. Pritisnite Opcije u podnožju pločice s kvalitetom i zatim pritisnite Zamijeni.
    Savjet: Za istovremenu zamjenu više vrijednosti odjednom poslužite se opcijom Zamijeni popis vrijednosti.
  4. U uređivaču koraka za zamjenu definirajte kako će se vrijednosti uskladiti. Na primjer:
    • Pritisnite Upotrijebi regularni izraz za usklađivanje putem složenog regularnog izraza (regex).
    • Pritisnite Uskladi samo cijele vrijednosti kako biste "male" promijenili u "M", no ne i "female" u "feM".
  5. U polju Niz za zamjenu i polju Novi niz definirajte literalni tekst ili regularne izraze koje želite pronaći i zamijeniti (razlikuju se velika i mala slova).
    Primjeri:
    • Želite li "2553 Bolman Court" promijeniti u "2553 #Bolman# #Court#", odaberite Upotrijebi regularni izraz, unesite ([A-Za-z]+) u polje Niz za zamjenu i unesite #$1# u polje Novi niz.
    • Želite li "male" zamijeniti s "M", odaberite Uskladi samo cijele vrijednosti, unesite male u polje Niz za zamjenu i unesite M u polje Novi niz. To će "male" zamijeniti s "M", no neće "female" zamijeniti s "feM".

    Kad ispunite oba polja, u prozoru pregleda prikazuje se pregled transformiranih podataka. Prilagođavajte opcije za zamjenu sve dok se u prozoru pregleda ne prikaže željena transformacija.
  6. Pritisnite Dodaj korak.
    Oracle Analytics dodaje korak u ploču Skripte za pripremu.
  7. Kako biste spremili promjene u pripremi podataka i primijenili ih na vaše podatke, pritisnite Spremi.

Primjeri transformacije zamjenom putem regularnih izraza

Ovdje je navedeno nekoliko primjera upotrebe regularnih (regex) izraza za transformaciju podataka.

U ovim primjerima u opciji Traži izraz prikazuje se ono što unosite u polje Niz za zamjenu, a u stupcu Zamijeni vrijednost prikazuje se ono što unosite u polje Novi niz.

Tablica 4-1 Primjer transformacija zamjenom

Traži izraz Zamijeni vrijednost Izvorni tekst Zamijenjeni tekst Napomene
@([a-z]+)(?=\.[a-z]{3}) @example MichelePFalk@yahoo.com MichelePFalk@example.com U ovom primjeru zamijenit će se pojedinosti domene u adresama e-pošte.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

Znak ^$ znači da će se tražiti samo oni nizovi koji odgovaraju cijelom izrazu. Okomita crta regularni je izraz za operator OR, pa će u ovom slučaju regularni izraz tražiti "Gray" ili "Grey" te ih zamijeniti sa "Silver".

Niz Graystone neće se transformirati jer regularni izraz traži samo nizove koji odgovaraju cijelom izrazu.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

Ovaj regularni izraz traži jednu " \d" ili više "+" znamenki i zamjenjuje ih s "9999". Ova zamjena funkcionira i kad originalni tekst ima samo tri znamenke.
([A-z]+)(\d+) $2

UA101654

US829383

101654

829383

Ovaj regularni izraz traži jedno "[A-z]" ili više "+" uzastopnih slova nakon koji slijedi jedna" \d" ili više "+" znamenki – svaki od dva izraza naveden je unutar zagrada, pa postoje dvije grupe – prva ([A-z]) i druga (\d+) – te grupe numeriraju se automatski i potom se mogu upotrijebiti u zamjeni tako da se za drugu grupu upotrijebi znak dolara, na primjer, "$2".
([A-z]+)(\d+) Poštanski broj: $2

UA101654

US829383

Poštanski broj: 101654

Poštanski broj: 829383

U ovom primjeru upotrebljava se isti izraz za usklađivanje kao u prethodnom primjeru, uz tu razliku što je u ovom primjeru prikazano kako se vlastiti zamjenski tekst može dodati u grupu. Tekst se može umetnuti prije ili nakon opozvane grupe za usklađivanje.