Transformujte data ve sloupci pomocí jednoduchého vzoru nebo regulárního výrazu. Například ve sloupci State (Stát) můžete změnit CA na plný název California.
Dále uvádíme několik příkladů použití regulárních výrazů k transformaci dat.
V těchto příkladech výraz pro vyhledávání ukazuje, co je zadáno v poli Řetězec k nahrazení, a hodnota nahrazení ukazuje, co je zadáno v poli Nový řetězec.
Tabulka 3-1 Ukázkové transformace nahrazení
Vyhledávací výraz | Hodnota nahrazení | Původní text | Nahrazený text | Poznámky |
---|---|---|---|---|
@([a-z]+)(?=\.[a-z]{3}) |
@example | MichelePFalk@yahoo.com | MichelePFalk@example.com | Tento příklad nahradí detaily domény v e-mailové adrese. |
^Gray|Grey$ |
Silver |
Grey Gray Graystone |
Silver Silver Graystone |
Znaky ^$ znamenají, že chcete hledat jen shody celého řetězce. Svislý pruh je regulární výraz pro logické OR, proto v tomto případě regulární výraz hledá "Gray" nebo "Grey" a nalezený řetězec nahradí řetězcem "Silver".
Řetězec Graystone není transformován, protože regulární výraz hledá jen shody celé hodnoty. |
\d+ |
9999 |
8398 Park Street 123 Oracle Parkway |
9999 Park Street 9999 Oracle Parkway |
Tento regulární výraz hledá jednu " \d" nebo více "+" číslic a nahradí je řetězcem "9999". Nahrazení proběhne i v případě, že původní text má pouze tři číslice. |
([A-z]+)(\d+) |
$2 |
UA101654 US829383 |
101654 829383 |
Tento regulární výraz hledá jedno "[A-z]" nebo více "+" za sebou jdoucích písmen následovaných jednou " \d" nebo více "+" číslicemi - každý z obou výrazů je uzavřen do závorek, čímž zachytí dvě skupiny znaků - první ([A-z]) a druhou (\d+) - tyto skupiny jsou automaticky očíslovány a je možné je následně použít ve výrazu nahrazení zápisem znaku dolaru a čísla skupiny, například "$2". |
([A-z]+)(\d+) |
Postal Code: $2 |
UA101654 US829383 |
Postal Code: 101654 Postal Code: 829383 |
Tento příklad používá stejný výraz shody jako předchozí příklad, ale navíc ukazuje, jak vložit vlastní nahrazující text do skupiny. Text lze vložit před nebo za vkládanou zachycenou skupinu znaků. |