Transformujte dáta v stĺpci pomocou jednoduchej zhody vzoru alebo regulárneho výrazu (regex). Napríklad v stĺpci Štát môžete zmeniť hodnotu CA na hodnotu Kalifornia.
V tejto časti nájdete niekoľko príkladov použitia regulárnych výrazov (regex) na transformáciu dát.
V týchto príkladoch sa v stĺpci Hľadaný výraz zobrazuje, čo zadať do poľa Reťazec na nahradenie, a stĺpec Náhradná hodnota zobrazuje, čo zadať do poľa Nový reťazec.
Tabuľka 4-1 Príklad transformácií nahradenia
Hľadaný výraz | Náhradná hodnota | Pôvodný text | Nahradený text | Poznámky |
---|---|---|---|---|
@([a-z]+)(?=\.[a-z]{3}) |
@example | MichelePFalk@yahoo.com | MichelePFalk@example.com | V tomto príklade sa nahradia detaily domény v e-mailových adresách. |
^Gray|Grey$ |
Silver |
Grey Gray Graystone |
Silver Silver Graystone |
Znaky ^$ znamenajú len vyhľadávanie úplne sa zhodujúcich reťazcov. Zvislý pruh je regulárny výraz pre operátor OR, takže v tomto prípade regulárny výraz vyhľadáva reťazce Gray alebo Grey a nahrádza ich reťazcom Silver.
Reťazec Graystone sa netransformuje, pretože regulárny výraz vyhľadáva len úplne sa zhodujúce reťazce. |
\d+ |
9999 |
8398 Park Street 123 Oracle Parkway |
9999 Park Street 9999 Oracle Parkway |
Tento regulárny výraz vyhľadáva jeden reťazec \d alebo viaceré číslice + a nahradí ich reťazcom 9999. Nahradenie funguje aj v prípade, že pôvodný text obsahuje len tri číslice. |
([A-z]+)(\d+) |
$2 |
UA101654 US829383 |
101654 829383 |
Tento regulárny výraz vyhľadáva jeden znak [A-z] alebo viaceré za sebou nasledujúce znaky +, za ktorými nasleduje jeden znak \d alebo viaceré číslice +. Každý z dvoch výrazov je ohraničený zátvorkami, ktoré uzatvárajú dve skupiny - prvú ([A-z]) a druhú (\d+) - tieto skupiny sú automaticky číslované a potom sa môžu použiť pri náhrade použitím znaku dolára pre druhú skupinu, napríklad $2. |
([A-z]+)(\d+) |
PSČ: $2 |
UA101654 US829383 |
PSČ: 101654 PSČ: 829383 |
V tomto príklade sa používa rovnaký výraz zhody ako v predchádzajúcom prípade, s tým rozdielom, že ukazuje, ako vložiť vlastný náhradný text okrem skupiny. Text môže byť vložený pred a za odvolanú skupinu zhody. |