Az oszlopban lévő adatokat vagy egyszerű mintaegyeztetéssel vagy reguláris kifejezéssel (regex) lehet átalakítani. Például az Állam oszlopban a CA rövidítés helyettesíthető a California államnévvel.
Ebben a részben néhány példát talál arra, hogy a reguláris kifejezések hogyan használhatók az adatok átalakítására.
Ezekben a példákban a Keresőkifejezés tartalmazza azt, hogy mit írna be a Cserélendő karakterlánc mezőbe, és a Cserélő érték mutatja azt, hogy mit írna az Új karakterlánc mezőbe.
4-1. Táblázat Példa a cserés átalakításokra
Kereső kifejezés | Helyettesítő érték | Eredeti szöveg | Helyettesített szöveg | Megjegyzések |
---|---|---|---|---|
@([a-z]+)(?=\.[a-z]{3}) |
@example | MichelePFalk@yahoo.com | MichelePFalk@example.com | Ez a példa lecseréli a tartományi részleteket az e-mail-címekben. |
^Gray|Grey$ |
Silver |
Grey Gray Graystone |
Silver Silver Graystone |
A ^$ karakterpár azt jelenti, hogy csak azokat a karakterláncokat keresi, amelyek teljes hosszukban azonosak a keresőkifejezéssel. A függőleges vonal jelentése a VAGY, tehát ebben a példában a "Gray" és a "Grey" is a "Silver" szóra lesz átalakítva.
A Graystone karakterlánc nem lesz átalakítva, mert a reguláris kifejezés itt csak azokat érzékeli találatként, ahol teljes az egyezés. |
\d+ |
9999 |
8398 Park Street 123 Oracle Parkway |
9999 Park Street 9999 Oracle Parkway |
Ez a reguláris kifejezés egy "\d", illetve több "+" számjegy előfordulását keresi, és cseréli ezekre a számjegyekre "9999". A csere (helyettesítés) akkor is működik, ha az eredeti szöveg csak három számjegyet tartalmaz. |
([A-z]+)(\d+) |
$2 |
UA101654 US829383 |
101654 829383 |
Ez a reguláris kifejezés keres egy "[A-z]" vagy több "+" egymást követő betűt, majd egy "\d" vagy több "+" számjegyet – mindkét kifejezés zárójelek között van, így két csoportot alkot – az első ([A-z]) és a második (\d+) csoportot – ezek a csoportok automatikusan sorszámot kapnak, és így használhatók a cseréléskor dollárjelet használva a második csoporthoz, például "$2". |
([A-z]+)(\d+) |
Irányítószám: $2 |
UA101654 US829383 |
Irányítószám: 101654 Irányítószám: 829383 |
Ez a példa ugyanazt az egyeztető kifejezést használja, mint az előző példa, kivéve, hogy azt is megmutatja, hogy hogyan kell beszúrni a saját szöveget kiegészítésként egy csoportba. A szöveg beszúrható az ismét meghívott egyező csoport elé és után is. |