置換を使用したデータの変換
単純なパターン一致または正規(regex)表現を使用して列のデータを変換します。たとえば、「状態」列では、CAをCaliforniaに変更できます。
正規表現を使用した置換変換の例
正規(regex)表現を使用してデータを変換する例をいくつか示します。
これらの例では、「置換する文字列」フィールドに入力する内容を「検索式」に示し、「新規文字列」フィールドに入力する内容を「置換値」に示しています。
文字列のテキストの置換
この例は、電子メール・アドレスのドメイン詳細を置換します。
検索式: @([a-z]+)(?=\.[a-z]{3})
置換値: @example
元のテキスト: MichelePFalk@yahoo.com
置換後のテキスト: MichelePFalk@example.com
一致した値の置換
^$
文字は、文字列全体の一致のみを探すことを意味します。垂直バーはOR
の正規表現であるため、この場合、正規表現はGrayまたはGreyを探し、Silverで置換します。
正規表現は値全体の一致のみを探すため、文字列Graystoneは変換されません。
検索式: ^Gray|Grey$
置換値: Silver
元のテキスト: Grey, Gray, and Graystone
置換後のテキスト: Silver, Silver, Graystone
マスク値
この正規表現は、\d
(1桁) +
(以上)の数値を探し、それらを9999に置き換えます。この置換は、元のテキストに3桁の数字のみが含まれる場合にも機能します。
検索式: \d+
置換値: 9999
元のテキスト: 8398 Park Street, 123 Oracle Parkway
置換後のテキスト: 9999 Park Street, 9999 Oracle Parkway
文字列からの文字の削除
この正規表現は、[A-z]
(1文字) +
(以上)の連続する文字に、\d
(1桁) +
(以上)の数字が続く文字列を探します。2つの式それぞれがカッコで囲まれているので、2つのグループ(最初は([A-z]
)で2番目は(\d+
))が取得されます。これらのグループには自動的に番号が付けられます。2番目のグループは、ドル記号を使用して$2
のように記述できます。
検索式: ([A-z]+)(\d+)
置換値: Postal Code: $2
元のテキスト: UA101654, US829383
置換後のテキスト: 101654, 829383
文字列へのテキストの追加
この例では、グループに加えて独自の置換テキストを挿入する方法を示していることを除き、前の例と同じ一致式を使用します。リコールされた一致グループの前後にテキストを挿入できます。
検索式: ([A-z]+)(\d+)
置換値: Postal Code: $2
元のテキスト: UA101654, US829383
置換後のテキスト: Postal Code: 101654, Postal Code: 829383