Trasformare i dati in una colonna utilizzando una corrispondenza di pattern semplice o un'espressione regolare (regex). Ad esempio, in una colonna Stato si potrebbe cambiare CA in California.
Di seguito sono riportati alcuni esempi dell'uso di espressioni regolari (regex) per trasformare i dati.
In questi esempi, Espressione di ricerca indica cosa immettere nel campo Stringa da sostituire, mentre Valore di sostituzione mostra il valore immesso nel campo Nuova stringa.
Tabella 4-1 Trasformazioni di sostituzione di esempio
Espressione di ricerca | Valore di sostituzione | Testo originale | Testo dopo la sostituzione | Note |
---|---|---|---|---|
@([a-z]+)(?=\.[a-z]{3}) |
@example | MichelePFalk@yahoo.com | MichelePFalk@example.com | In questo esempio i dettagli del dominio vengono sostituiti negli indirizzi di posta elettronica. |
^Gray|Grey$ |
Silver |
Grey Gray Graystone |
Silver Silver Graystone |
I caratteri ^$ indicano che devono essere cercate solo le corrispondenze della stringa completa. La barra verticale è l'espressione regolare per l'operatore OR, pertanto in questo caso l'espressione regolare cerca "Gray" o "Grey" e lo sostituisce con "Silver".
La stringa Graystone non viene trasformata perché l'espressione regolare cerca solo le corrispondenze di valori interi. |
\d+ |
9999 |
8398 Park Street 123 Oracle Parkway |
9999 Park Street 9999 Oracle Parkway |
Questa espressione regolare cerca una cifra "\d" o più cifre "+" e le sostituisce con "9999". La sostituzione funziona anche quando il testo originale contiene solo tre cifre. |
([A-z]+)(\d+) |
$2 |
UA101654 US829383 |
101654 829383 |
Questa espressione regolare cerca una lettera "[A-z]" o più lettere consecutive "+" seguite da una cifra "\d" o più cifre "+". Ognuna delle due espressioni, racchiusa tra parentesi, acquisisce due gruppi: il primo ([A-z]) e il secondo (\d+). Questi gruppi vengono numerati in modo automatica e possono essere utilizzati nella sostituzione inserendo il simbolo del dollaro per il secondo gruppo, ad esempio "$2". |
([A-z]+)(\d+) |
Codice postale: $2 |
UA101654 US829383 |
Codice postale: 101654 Codice postale: 829383 |
In questo esempio viene utilizzata la stessa espressione di corrispondenza dell'esempio precedente, ma viene inoltre indicato come inserire un testo di sostituzione personalizzato oltre a un gruppo. Il testo può essere inserito prima e dopo un gruppo di corrispondenza richiamato. |