Transformeer gegevens in een kolom met behulp van een eenvoudige patroonovereenkomst of een reguliere uitdrukking (regex). In de kolom 'Staat' kunt u CA bijvoorbeeld wijzigen in Californië.
Hier volgen enkele voorbeelden van het gebruik van reguliere uitdrukkingen (regex) om gegevens te transformeren.
In deze voorbeelden ziet u in 'Zoekuitdrukking' wat u moet invoeren in het veld Te vervangen string. In 'Vervangingswaarde' ziet u wat u moet invoeren in het veld Nieuwe string.
Tabel 4-1 Voorbeelden van het vervangen van transformaties
Zoekuitdrukking | Vervangingswaarde | Oorspronkelijke tekst | Vervangen tekst | Opmerkingen |
---|---|---|---|---|
@([a-z]+)(?=\.[a-z]{3}) |
@voorbeeld | MichelePFalk@yahoo.com | MichelePFalk@voorbeeld.com | In dit voorbeeld worden de domeingegevens in het e-mailadres vervangen. |
^Grijs|Grijstint$ |
Zilver |
Grijs Grijstint Grijstinten |
Zilver Zilver Grijstinten |
De tekens ^$ geven aan dat er alleen mag worden gezocht naar overeenkomsten met de volledige string. De verticale balk is de reguliere uitdrukking voor OF. In dit geval wordt met de reguliere uitdrukking gezocht naar "Grijs" of "Grijstint" en wordt deze vervangen door "Zilver".
De string Grijstinten wordt niet getransformeerd omdat met de reguliere uitdrukking alleen wordt gezocht naar overeenkomsten met de volledige waarde. |
\d+ |
9999 |
Schoolstraat 8398 Hoofdweg 123 |
Schoolstraat 9999 Hoofdweg 9999 |
Met deze reguliere uitdrukking wordt gezocht naar één "\d" of meer "+" cijfers en worden deze vervangen door "9999". De vervanging werkt ook als de oorspronkelijke tekst maar drie cijfers bevat. |
([A-z]+)(\d+) |
$2 |
UA101654 US829383 |
101654 829383 |
Met deze reguliere uitdrukking wordt gezocht naar één "[A-z]" of meer "+" opeenvolgende letters gevolgd door één "\d" of meer "+" getallen. Elk van de twee uitdrukkingen bevat haakjes waarmee twee groepen worden gedefinieerd. De eerste groep is ([A-z]) en de tweede (\d+). Deze groepen worden automatisch genummerd en kunnen vervolgens in de vervanging worden gebruikt door het dollarteken voor de tweede groep te gebruiken, bijvoorbeeld "$2". |
([A-z]+)(\d+) |
Postcode: $2 |
UA101654 US829383 |
Postcode: 101654 Postcode: 829383 |
In dit voorbeeld wordt dezelfde overeenkomstuitdrukking gebruikt als in het vorige voorbeeld. In dit voorbeeld wordt echter getoond hoe u naast een groep uw eigen vervangende tekst invoegt. Tekst kan worden ingevoegd voor en na een ingetrokken overeenkomstgroep. |