1.3.10.31 正規表現の一致
「正規表現の一致」プロセッサは、正規表現に対して属性のデータを照合し、一致するデータを新しい属性に出力します。また、正規表現の中で一致したグループすべての配列が設定された属性を追加します。
「正規表現の一致」は、正規表現と一致するデータを抽出する簡単な方法として使用してください。これはグループの配列を作成する場合に特に便利です。
正規表現のグループは、カッコの中に記載することに注意してください。1つの正規表現に多数のグループが存在する可能性があります。
「正規表現の一致」は、正規表現全体に対して一致した値が格納された属性と、正規表現の中で一致するグループの配列が格納された属性の2つの属性を追加します。一致するものがなかった場合、新しい属性は両方ともnullになります。
正規表現
正規表現は、パターンを表現し、文字列を操作するための標準の手法であり、一度習得すると非常に有用です。
正規表現に関するチュートリアルや参考資料はインターネットで入手できます。また、Jeffrey E. F. Friedl著、O'Reilly UK発行の『Mastering Regular Expressions』(ISBN: 0-596-00289-0)などの書籍も参考になります。
また、正規表現の習得に役立つソフトウェア・パッケージ(RegExBuddyなど)や、有益な正規表現のオンライン・ライブラリ(RegExLibなど)も使用できます。
次の表に、構成オプションを示します。
構成 | 説明 |
---|---|
入力 |
単一の文字列属性を指定します。 |
オプション |
次のオプションを指定します。
|
出力 |
データ属性またはフラグ属性の出力を記述します。 |
データ属性 |
次のデータ属性が出力されます。
|
フラグ |
次のフラグが出力されます。
|
次の表に、このプロファイラによって生成される統計情報を示します。
統計 | 説明 |
---|---|
一致 |
正規表現と一致したレコードの数。 |
不一致 |
正規表現と一致しなかったレコードの数。 |
出力フィルタ
「正規表現の一致」プロセッサからは、次の出力フィルタが使用可能です。
-
正規表現と一致したレコード
-
正規表現と一致しなかったレコード
例
この例では、ADDRESS3属性内の値を、次の英国郵便番号の正規表現と照合します。
([A-Z]{1,2}[0-9]{1,2}|[A-Z]{3}|[A-Z]{1,2}[0-9][A-Z]) +([0-9][A-Z]{2})
一致した値 | 不一致の値 |
---|---|
170 |
1831 |
「一致した値」へのドリルダウン:
値が一致すると、区別された各グループ(つまり、外側コードと内側コード)に一致する値で配列が作成されます。
ADDRESS3 | RegExMatchFull | RegExMatchGroups |
---|---|---|
SP7 9QJ |
SP7 9QJ |
{SP7}{9QJ} |
BA16 0BB |
BA16 0BB |
{BA16}{0BB} |
LA9 7BT |
LA9 7BT |
{LA9}{7BT} |
E16 2AG |
E16 2AG |
{E16}[2AG} |
SN1 5BB |
SN1 5BB |
{SN1}{5BB} |