正規表現の一致

「正規表現の一致」プロセッサは、正規表現に対して属性のデータを照合し、一致するデータを新しい属性に出力します。また、正規表現の中で一致したグループすべての配列が設定された属性を追加します。

「正規表現の一致」は、正規表現と一致するデータを抽出する簡単な方法として使用してください。これはグループの配列を作成する場合に特に便利です。

正規表現のグループは、カッコの中に記載することに注意してください。1つの正規表現に多数のグループが存在する可能性があります。

「正規表現の一致」は、正規表現全体に対して一致した値が格納された属性と、正規表現の中で一致するグループの配列が格納された属性の2つの属性を追加します。一致するものがなかった場合、新しい属性は両方ともnullになります。

正規表現

正規表現は、パターンを表現し、文字列を操作するための標準の手法であり、一度習得すると非常に有用です。

正規表現に関するチュートリアルや参考資料はインターネットで入手できます。また、Jeffrey E. F. Friedl著、O'Reilly UK発行の『Mastering Regular Expressions』(ISBN: 0-596-00289-0)などの書籍も参考になります。

また、正規表現の習得に役立つソフトウェア・パッケージ(RegExBuddyなど)や、有益な正規表現のオンライン・ライブラリ(RegExLibなど)も使用できます。

次の表に、構成オプションを示します。

構成 説明

入力

単一の文字列属性を指定します。

オプション

次のオプションを指定します。

  • 正規表現: 照合する正規表現(正規表現として指定します)。デフォルト値: None

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

次のデータ属性が出力されます。

  • RegExMatchFull: 正規表現全体が一致した値を格納します。値は、正規表現と一致した場合は元の入力値になり、正規表現と一致しなかった場合はnull値になります。

  • RegExMatchGroups: 正規表現の中の各グループと一致する値の配列を格納します。値は、正規表現の各グループと一致した値の配列です。

フラグ

次のフラグが出力されます。

  • RegExMatchSuccess: 「正規表現の一致」が成功したかどうかを示します。使用可能な値はY/Nです。

次の表に、このプロファイラによって生成される統計情報を示します。

統計 説明

一致

正規表現と一致したレコードの数。

不一致

正規表現と一致しなかったレコードの数。

出力フィルタ

「正規表現の一致」プロセッサからは、次の出力フィルタが使用可能です。

  • 正規表現と一致したレコード

  • 正規表現と一致しなかったレコード

この例では、ADDRESS3属性内の値を、次の英国郵便番号の正規表現と照合します。

([A-Z]{1,2}[0-9]{1,2}|[A-Z]{3}|[A-Z]{1,2}[0-9][A-Z]) +([0-9][A-Z]{2})

一致した値 不一致の値

170

1831

「一致した値」へのドリルダウン:

値が一致すると、区別された各グループ(つまり、外側コードと内側コード)に一致する値で配列が作成されます。

ADDRESS3 RegExMatchFull RegExMatchGroups

SP7 9QJ

SP7 9QJ

{SP7}{9QJ}

BA16 0BB

BA16 0BB

{BA16}{0BB}

LA9 7BT

LA9 7BT

{LA9}{7BT}

E16 2AG

E16 2AG

{E16}[2AG}

SN1 5BB

SN1 5BB

{SN1}{5BB}