Transformera data genom att ersätta

Transformera data i en kolumn med hjälp av en enkel mönstermatchning eller ett reguljärt uttryck (regex). I en delstatskolumn kan du till exempel ändra CA till Kalifornien.

Du kan använda valfritt Perl-kompatibelt reguljärt uttryck (PCRE), som även kallas regex-uttryck. Transformeringar tillämpas på varje tillämplig rad i en datamängd.
  1. På hemsidan håller du muspekaren över en datamängd du äger, klickar på Åtgärder och väljer Öppna.
    Om datamängden innehåller en enda tabell visas transformeringsredigeraren. Om datamängden innehåller flera tabeller visas ett kopplingsdiagram. I Kopplingsdiagram högerklickar du på en datakälla och klickar på Öppna så visas transformeringsredigeraren.

  2. Håll muspekaren över eller välj textkolumnen du vill transformera.
  3. Klicka på Alternativ längst ned på kvalitetspanelen och klicka på Ersätt.
    Tips! Du kan ersätta flera värden samtidigt med alternativet Ersätt värdelista.
  4. I redigeringsprogrammet för att ersätta steg anger du hur du vill matcha värden. Exempel:
    • Om du vill matcha med ett komplext reguljärt uttryck klickar du på Använd reguljärt uttryck.
    • Om du vill att ”male” ska ändras till ”M” men inte ”female” till ”feM” klickar du på Matcha endast hela värden.
  5. I fälten Sträng att ersätta och Ny sträng anger du den litteraltext eller de reguljära uttryck som ska sökas och ersättas (skiftlägeskänsligt).
    Exempel:
    • Om du vill att ”2553 Bolman Court” ska ändras till ”2553 #Bolman# #Court#” ska du välja Använd reguljärt uttryck, ange ([A-Za-z]+) i fältet Sträng att ersätta och ange #$1# i fältet Ny sträng.
    • Om du vill att ”male” ska ändras till ”M” ska du välja Matcha endast hela värden, ange male i fältet Sträng att ersätta och ange M i fältet Ny sträng. Detta ändrar ”male” till ”M” men ändrar inte ”female” till ”feM”.

    När du fyllt i båda fälten visas en förhandsgranskning av transformerade data i förhandsgranskningsrutan. Justera alternativen för ersättning tills du får den transformering du vill ha i förhandsgranskningsrutan.
  6. Klicka på Lägg till steg.
    Oracle Analytics lägger till ett steg i panelen Förberedelseskript.
  7. Om du vill spara ändringarna i dataförberedelsen och tillämpa dem på dina data klickar du på Spara.

Exempel: Ersätta transformeringar med hjälp av reguljära uttryck

Här följer några exempel på att använda reguljära uttryck (regex) till att transformera data.

I de här exemplen visar Sökuttryck vad du ska ange i fältet Sträng att ersätta och Ersätt värde visar vad du ska ange i fältet Ny sträng.

Tabell 3-1 Exempel: ersätta transformeringar

Sökuttryck Ersätt värde Ursprunglig text Ersatt text Anmärkningar
@([a-z]+)(?=\.[a-z]{3}) @exempel MichelePFalk@yahoo.com MichelePFalk@exempel.com Det här exemplet ersätter domänuppgifter i e-postadresser.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

Tecknet ^$ anger en sökning efter enbart hela strängmatchningar. Det vertikala fältet är det reguljära uttrycket för OR, så i det här fallet söker det reguljära uttrycket efter "Gray" eller "Grey" och ersätter det med "Silver".

Strängen Graystone transformeras inte eftersom det reguljära uttrycket endast söker efter hela värdematchningar.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

Det här reguljära uttrycket söker efter en " \d" eller fler "+" siffror och ersätter dem med "9999". Ersättningen fungerar också när originaltexten bara har tre siffror.
([A-z]+)(\d+) $2

UA101654

US829383

101654

829383

Det här reguljära uttrycket söker efter ett "[A-z]" eller flera "+" bokstäver i följd följt av en " \d" eller flera "+" siffror. Vart och ett av de båda uttrycken omges av parenteser, vilket fångar två grupper – den första ([A-z]) och den andra (\d+). Dessa grupper numreras automatiskt och kan sedan användas i ersättningen genom att dollartecknet används för den andra gruppen, till exempel "$2".
([A-z]+)(\d+) Postnummer: $2

UA101654

US829383

Postnummer: 101654

Postnummer: 829383

I det här exemplet används samma matchningsuttryck som i det föregående exemplet, förutom att det visar hur du infogar egen ersättande text utöver att infoga en grupp. Text kan infogas före och efter en återkallad matchningsgrupp.