RegEx Check |
「RegEx Check」プロセッサでは、属性内のデータをその属性に対する有効および無効な正規表現の参照リストと照合してチェックします。
チェックの大/小文字区別およびマッチ方法(Whole Value/Contains/Starts With/Ends With)を制御できます。
正規表現に関する注意
正規表現は、パターンを表現し、文字列を操作するための標準の手法であり、一度習得すると非常に強力です。
正規表現に関するチュートリアルおよび参照資料は、インターネット上で次のサイトから入手できます。
次の書籍もあります。
また、正規表現の習得に役立つソフトウェア・パッケージ(RegExBuddyなど)、および有益な正規表現のオンライン・ライブラリ(RegExLibなど)も利用できます。
「RegEx Check」プロセッサは強力なツールであり、データの位置、部分値と全体値、およびワイルドカードを使用して、その正確な内容に従ってデータを検証できます。
「RegEx Check」は、国民保険番号(英国)など、一貫した構成である必要があるデータをチェックするのに役立ちます。
次に、データのチェックに使用される正規表現の例をいくつか示します。
正規表現 |
パターンの意味 |
^\d{5}$ |
5つの整数の郵便番号(米国) |
([A-Z]{1,2}[0-9]{1,2}|[A-Z]{3}|[A-Z]{1,2}[0-9][A-Z])( |-)[0-9][A-Z]{2} |
有効な郵便番号(英国) |
^[A-CEGHJ-PR-TW-Z]{1}[A-CEGHJ-NPR-TW-Z]{1}[0-9]{6}[A-DFM]{0,1}$ |
有効な国民保険番号(英国) |
^([a-zA-Z0-9_\-\.]+)@([a-zA-Z0-9_\-\.]+)\.([a-zA-Z]{2,5})$ |
有効なEメール・アドレス |
その他の多数の例をインターネットおよび他のソースから入手できます。
有効または無効な正規表現(あるいはその両方)のリストに基づいてチェックする単一の属性。
Valid patterns
オプション |
タイプ |
目的 |
デフォルト値 |
Reference Data |
参照データ(「Regular Expressions」カテゴリ) |
属性に対する有効な正規表現のリスト |
なし |
Regular expression |
自由形式テキスト |
参照データを使用せずに、有効パターンに対する単一の正規表現を指定できるようにします。 このオプションを参照データとともに使用する場合は、すべての正規表現(両方のオプション)がチェックで使用されることに注意してください。 |
なし |
Categorize unmatched as |
選択(Unknown/Invalid) |
有効な正規表現のリストとマッチしない値の分類方法 |
Unknown |
Invalid patterns
オプション |
タイプ |
目的 |
デフォルト値 |
Reference Data |
参照データ(「Regular Expressions」カテゴリ) |
属性に対する無効な正規表現のリスト |
なし |
Regular expression |
自由形式テキスト |
参照データを使用せずに、無効パターンに対する単一の正規表現を指定できるようにします。 このオプションを参照データとともに使用する場合は、すべての正規表現(両方のオプション)がチェックで使用されることに注意してください。 |
なし |
Categorize unmatched as |
選択(Unknown/Valid) |
正規表現のリストとマッチしない値の分類方法 |
Unknown |
Match options
オプション |
タイプ |
目的 |
デフォルト値 |
Ignore case? |
Yes/No |
リストを照合するときに、大/小文字を無視するかどうかを決定します。 |
Yes |
Match list by |
選択 (Whole Value/Contains/Starts With/Ends With) |
リストとの照合方法を決定します。 |
Whole Value |
なし
フラグ属性 |
目的 |
可能性のある値 |
RegExValid |
どのデータが「RegExCheck」に合格したかを、有効なRegEx、無効なRegExおよび不明パターンで示します。 |
Y/N/- |
「RegEx Check」の結果は、ダッシュボードに公開できます。
次の結果解釈がデフォルトで使用されます。
結果 |
|
Valid |
合格 |
Unknown |
警告 |
Invalid |
アラート |
実行モード |
サポート |
バッチ |
Yes |
リアルタイム・モニタリング |
Yes |
リアルタイム応答 |
Yes |
「RegEx Check」では、結果のサマリー・ビューが作成され、次の統計が表示されます。
統計 |
意味 |
Valid records |
「RegEx Check」によって「Valid」に分類されたレコード。 |
Unknown records |
「RegEx Check」によって「Unknown」に分類されたレコード。 |
Invalid records |
「RegEx Check」によって「Invalid」に分類されたレコード。 |
前述の統計のいずれかをドリルダウンすると、「Valid」、「Unknown」または「Invalid」であると判明したそれぞれの値の数が表示されます。次に、再度ドリルダウンするとレコード自体を表示できます。
「RegEx Check」からは、次の出力フィルタが使用可能です。
この例では、「RegEx Check」を使用して、次の正規表現との「Whole Value」マッチを使用して、「Account Number」属性(CU_ACCOUNT)の形式をチェックします。
^([0-9]{2})(-)([0-9]{4,5})(-)([a-zA-Z]{2})
この正規表現は、値が正確に2桁の数字で始まり、その後にハイフン、4桁または5桁の数字、別のハイフン、2文字の順に続く必要があることを示します。
サマリー・ビュー
「Invalid Records」のドリルダウン
この場合、00(ゼロが2つ)ではなくOO(大文字のOが2つ)を含むレコードがいくつか検出されたことに注意してください。
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.