Transformere data ved hjælp af Erstat

Transformer data i en kolonne ved hjælp af et enkelt mønstermatch eller et almindeligt udtryk (regex). I en kolonne med navne på stater kan du for eksempel ændre CA til Californien.

Du kan bruge ethvert PCRE (Perl Compatible Regular Expression - PERL-kompatibelt almindeligt udtryk), der også kaldes RegEx-udtryk. Transformationer anvendes på alle relevante rækker i et datasæt.
  1. Hold musemarkøren over et datasæt, som du ejer, på Startside, klik på Handlinger, og vælg derefter Åbn.
    Hvis datasættet indeholder en enkelt tabel, vises transformationseditoren. Hvis datasættet indeholder flere tabeller, vises Sammenkæd diagram. Højreklik på en datakilde i Sammenkæd diagram, og klik på Åbn for at vise transformationseditoren.

  2. Hold musemarkøren over eller vælg den tekstkolonne, som du vil transformere.
  3. Klik på Valg nederst i kvalitetsruden, og klik derefter på Erstat.
    Tip: Hvis du vil erstatte mere end én værdi ad gangen, skal du bruge valget Erstat værdiliste.
  4. Angiv, hvordan du vil matche værdier, i trineditoren for Erstat. Eksempel:
    • Klik på Brug almindeligt udtryk for at matche ved hjælp af et komplekst almindeligt udtryk (regex).
    • Klik på Match kun hele værdier for at ændre "male" til "M", men ikke "female" til "feM".
  5. Angiv litteralteksten eller de almindelige udtryk, som du vil søge efter og erstatte (forskel på små og store bogstaver), i feltet Streng, der skal erstattes og feltet Ny streng.
    Eksempler:
    • Hvis du skal ændre "2553 Bolman Court" til "2553 #Bolman# #Court#", skal du vælge Brug almindeligt udtryk, indtaste ([A-Za-z]+) i feltet Streng, der skal erstattes og indtaste #$1# i feltet Ny streng.
    • Hvis du skal ændre "male" til "M", skal du vælge Match kun hele værdier, indtaste male i feltet Streng, der skal erstattes og indtaste M i feltet Ny streng. Det ændrer "male" til "M", men ikke "female" til "feM".

    Når du har udfyldt begge felter, kan du se en eksempelvisning af de transformerede data i eksempelruden. Reguler erstatningsvalgene, indtil den ønskede transformation vises i eksempelruden.
  6. Klik på Tilføj trin.
    Oracle Analytics føjer et trin til Forberedelsesscriptpanel.
  7. Klik på Gem for at gemme ændringerne af dataforberedelserne og anvende dem på dine data.

Eksempel på transformationer med Erstat ved hjælp af almindelige udtryk

Her vises blot nogle få eksempler på brugen af almindelige udtryk (regex) til transformation af data.

I disse eksempler viser Søgeudtryk, hvad der skal indtastes i feltet Streng, der skal erstattes, og Erstatningsværdi viser, hvad der skal indtastes i feltet Ny streng.

Tabel 3-1 Eksempel på transformationer med Erstat

Søgeudtryk Erstatningsværdi Oprindelig tekst Erstattet tekst Bemærkninger
@([a-z]+)(?=\.[a-z]{3}) @example MichelePFalk@yahoo.com MichelePFalk@example.com Dette eksempel erstatter domænedetaljer i e-mailadresser.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

Tegnet ^$ betyder, at der kun skal søges efter matchninger af hele strenge. Den lodrette streg er det almindelige udtryk for OR, så i dette tilfælde søger det almindelige udtryk efter enten "Gray" eller "Grey" og erstatter det med "Silver".

Strengen Graystone transformeres ikke, fordi det almindelige udtryk kun søger efter matchninger af hele værdier.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

Dette almindelige udtryk søger efter ét ("\d") eller flere ("+") cifre og erstatter dem med "9999". Erstatningen sker også, hvis den oprindelige tekst kun indeholder tre cifre.
([A-z]+)(\d+) $2

UA101654

US829383

101654

829383

Dette almindelige udtryk søger efter ét ("[A-z]") eller flere ("+") på hinanden følgende bogstaver efterfulgt af ét (" \d") eller flere ("+") cifre - de to udtryk er begge afgrænset af parenteser, som danner to grupper - den første ([A-z]) og den anden (\d+) - disse grupper nummereres automatisk og kan derefter bruges i erstatningen, ved at dollartegnet angives for den anden gruppe, for eksempel "$2".
([A-z]+)(\d+) Postnummer: $2

UA101654

US829383

Postnummer: 101654

Postnummer: 829383

Dette eksempel bruger det samme matchningsudtryk som det tidligere eksempel, bortset fra at det viser, hvordan du indsætter din egen erstatningstekst foruden en gruppe. Tekst kan indsættes før og efter en genkaldt matchningsgruppe.