Adatok átalakítása cserével

Az oszlopban lévő adatokat vagy egyszerű mintaegyeztetéssel vagy reguláris kifejezéssel (regex) lehet átalakítani. Például az Állam oszlopban a CA rövidítés helyettesíthető a California államnévvel.

Minden Perl kompatibilis reguláris kifejezés (PCRE) használható (ezeket regex kifejezéseknek is nevezik). Az ilyen átalakítás (transzformálás) az adatkészlet minden használható sorára alkalmazható.
  1. A Kezdőlapon vigye az egérmutatót egy Ön által tulajdonolt adatkészlet fölé, kattintson a Műveletek lehetőségre, majd válassza ki a Megnyitás elemet.
    Ha az adatkészlet egyetlen táblát tartalmaz, megjelenik az átalakításszerkesztő. Ha az adatkészlet több táblát tartalmaz, megjelenik az Összekapcsolási diagram. Az Összekapcsolási diagram menüpontban kattintson a jobb egérgombbal a Megnyitás elemre az átalakításszerkesztő megjelenítéséhez.

  2. Jelölje ki az átalakítani kívánt szöveges oszlopot, vagy vigye fölé az egérmutatót.
  3. Kattintson az Opciók elemre a minőség csempe alapjánál, majd kattintson a Csere lehetőségre.
    Tipp: Egyszerre több érték cseréjéhez használja az Értéklista cseréje lehetőséget.
  4. A Csere lépésszerkesztőjében adja meg, hogy hogyan szeretné egyeztetni az értékeket. Például:
    • Kattintson a Reguláris kifejezés használata elemre, hogy az egyeztetést összetett reguláris kifejezés (regex) használatával végezhesse.
    • A Csak teljes értékek egyeztetése elemre kattintva módosítsa a "male" értéket "M" értékre, de a "female" értéket ne módosítsa "feM" értékre.
  5. A Cserélendő karakterlánc mezőben és az Új karakterlánc mezőben adja meg a keresett, illetve a helyettesítő szöveget vagy betű szerint, vagy reguláris kifejezéssel (kis- és nagybetűk megkülönböztetése).
    Példák:
    • A "2553 Bolman Court" érték "2553 #Bolman# #Court#" értékre módosításához válassza ki a Reguláris kifejezés használata lehetőséget, és a Cserélendő karakterlánc mezőbe írja be az ([A-Za-z]+) értéket, az Új karakterlánc mezőbe pedig írja be a #$1# értéket.
    • A "male" érték "M" értékre módosításához válassza ki a Csak teljes értékek egyeztetése lehetőséget, és a Cserélendő karakterlánc mezőbe írja be a male értéket, az Új karakterlánc mezőbe pedig írja be az M értéket. Ez a művelet a "male" értéket "M" értékre módosítja, de a "female" értéket nem módosítja "feM" értékre.

    Amikor elkészült mindkét mezővel, az átalakított adatok előnézetét megtekintheti az előzetes megtekintési ablaktáblán. Addig módosítsa a kicserélési beállításokat, amíg az előzetes megtekintési ablaktáblában meg nem jelenik a kívánt átalakítás.
  6. Kattintson a Lépés hozzáadása elemre.
    Az Oracle Analytics lépést vesz fel az Előkészítési parancsfájl panelen.
  7. Az adat-előkészítési módosítások mentéséhez és az adatokra való alkalmazásához kattintson a Mentés gombra.

Példa a reguláris kifejezések (regex) használatára az adatok átalakításakor

Ebben a részben néhány példát talál arra, hogy a reguláris kifejezések hogyan használhatók az adatok átalakítására.

Ezekben a példákban a Keresőkifejezés tartalmazza azt, hogy mit írna be a Cserélendő karakterlánc mezőbe, és a Cserélő érték mutatja azt, hogy mit írna az Új karakterlánc mezőbe.

4-1. Táblázat Példa a cserés átalakításokra

Kereső kifejezés Helyettesítő érték Eredeti szöveg Helyettesített szöveg Megjegyzések
@([a-z]+)(?=\.[a-z]{3}) @example MichelePFalk@yahoo.com MichelePFalk@example.com Ez a példa lecseréli a tartományi részleteket az e-mail-címekben.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

A ^$ karakterpár azt jelenti, hogy csak azokat a karakterláncokat keresi, amelyek teljes hosszukban azonosak a keresőkifejezéssel. A függőleges vonal jelentése a VAGY, tehát ebben a példában a "Gray" és a "Grey" is a "Silver" szóra lesz átalakítva.

A Graystone karakterlánc nem lesz átalakítva, mert a reguláris kifejezés itt csak azokat érzékeli találatként, ahol teljes az egyezés.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

Ez a reguláris kifejezés egy "\d", illetve több "+" számjegy előfordulását keresi, és cseréli ezekre a számjegyekre "9999". A csere (helyettesítés) akkor is működik, ha az eredeti szöveg csak három számjegyet tartalmaz.
([A-z]+)(\d+) $2

UA101654

US829383

101654

829383

Ez a reguláris kifejezés keres egy "[A-z]" vagy több "+" egymást követő betűt, majd egy "\d" vagy több "+" számjegyet – mindkét kifejezés zárójelek között van, így két csoportot alkot – az első ([A-z]) és a második (\d+) csoportot – ezek a csoportok automatikusan sorszámot kapnak, és így használhatók a cseréléskor dollárjelet használva a második csoporthoz, például "$2".
([A-z]+)(\d+) Irányítószám: $2

UA101654

US829383

Irányítószám: 101654

Irányítószám: 829383

Ez a példa ugyanazt az egyeztető kifejezést használja, mint az előző példa, kivéve, hogy azt is megmutatja, hogy hogyan kell beszúrni a saját szöveget kiegészítésként egy csoportba. A szöveg beszúrható az ismét meghívott egyező csoport elé és után is.