パターン・チェック

「パターン・チェック」プロセッサは、属性内のデータのパターンを有効パターンおよび無効パターンの参照リストと照合してチェックします。複数の単一入力または配列入力を使用します。

「パターン・チェック」プロセッサは、ある属性のデータがその属性の有効パターンの1つに準拠していることを保証するために使用します。技術上またはビジネス上の理由で、データが有効パターンのセットに準拠する必要がある場合があります。たとえば、データの移行時に、ターゲット・システムで特定の属性のデータがすべて数字のみで構成されている必要があり、さらに最小長と最大長の制限が設けられている場合があります。あるいは、ビジネス上の理由で、不正なデータや属性にあわないデータ(たとえば名前のフィールドに入っている数値や無効な製品コードなど)が含まれているレコードを、無効なレコードとしてタグ付けする場合があります。

有効パターンと無効パターンのリストは、パターン・プロファイラを使用してデータ自体から作成できます。

パターン・チェックでは、参照リストを2つまで(属性の有効パターンのリストと無効パターンのリスト)使用できます。

この2つのリストのうち1つのみを使用することもできます。たとえば、プロファイリングによって、ある属性に対して多数の様々な有効パターンが存在することがわかった場合は、その属性の無効パターンのみをチェックし、一致しない値を有効または不明とみなすことができます。

ただし、属性の有効パターンの数が少ない場合は、単にデータを有効パターンのリストと照合してチェックし、一致しない値を無効または不明とみなすことができます。

最後に、両方のリストを使用して、有効パターンと無効パターンの両方を認識し、いずれのリストとも一致しない値を不明に分類できます。

次の表に、構成オプションを示します。

構成 説明

入力

有効パターンまたは無効パターン(あるいはその両方)をチェックする単一または配列属性を1つ以上指定します。

オプション

次の有効値オプションを指定します。

  • 文字マップ参照データ: 各文字をパターン文字にマップします。参照データ(パターン生成カテゴリ)として指定します。

    デフォルトの*基本のトークン化マップは、かわりの*Unicodeの基本のトークン化マップや*Unicode文字パターン・マップと同様に、Latin-1エンコード・データで使用するように設計されています。これらのマップがデータの文字エンコーディングに適していない場合は、たとえばマルチバイトのUnicode (16進数)文字参照などを考慮に入れた新しいマップを作成して使用できます。

    デフォルト値: *文字パターン・マップ

次の有効パターン・オプションを指定します。

  • 参照データ: 属性の有効パターンのリスト。参照データ(パターン・カテゴリ)として指定します。デフォルト値: None

  • 不一致を次のように分類: 有効パターンのリストと一致しない値の分類方法。選択して指定します(不明/無効)。デフォルト値: 不明

  • 有効なパターン: 有効と分類された数に基づいた、レコードに複数の入力または配列入力が含まれる場合のレコードの分類方法。選択して指定します(すべての値/任意の値)。デフォルト値: すべての値

次の無効パターン・オプションを指定します。

  • 参照データ: 属性の無効パターンのリスト。参照データ(パターン・カテゴリ)として指定します。デフォルト値: None

  • 不一致を次のように分類: 無効パターンのリストと一致しない値の分類方法。選択して指定します(不明/無効)。デフォルト値: 不明

  • 無効なパターン: 無効と分類された数に基づいた、レコードに複数の入力または配列入力が含まれる場合のレコードの分類方法。選択して指定します(すべての値/任意の値)。デフォルト値: すべての値

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

なし。

フラグ

次のフラグが出力されます。

  • [Attribute Name].Pattern: 選択した属性のパターンを示します。属性値が一致したパターンが含まれます。

  • [Attribute Name].PatternValid: どのデータがパターン・チェックに合格したかを、有効パターン、無効パターンおよび不明パターンで示します。使用可能な値はY/N/-です。

レコード全体に対して単一のサマリー・フラグも出力されます。

  • PatternValid: レコードがパターン・チェックに合格したかどうかを示します。使用可能な値はY/N/-です。

次の表に、このプロファイラによって生成される統計情報を示します。

統計 説明

有効レコード

パターン・チェックで有効と分類されたレコード。

不明レコード

パターン・チェックで不明と分類されたレコード。

無効レコード

パターン・チェックで無効と分類されたレコード。

前述のいずれかの統計値をドリルダウンすると、有効、不明または無効と判明したパターンの数がそれぞれ表示されます。その後再びドリルダウンすると、レコード自体を表示できます。

出力フィルタ

次の出力フィルタを使用できます。

  • 有効レコード

  • 不明レコード

  • 無効レコード

この例では、パターン・プロファイリングから生成された有効パターンおよび無効パターンのリストを使用してパターン・チェックを実行し、アカウント番号属性(CU_ACCOUNT)の値を検証しています。

いずれのパターン・リストとも一致しなかった値は不明に分類されています。

サマリー・ビュー:

有効レコード 不明レコード 無効レコード

1991

1

9

無効レコードのドリルダウン:

カウント %

aa-NNNNN-aa

4

0.2

NN-NNN-aa

2

<0.1

NN-NNNNN-Na

1

<0.1

NN-NNNNN-

1

<0.1

NN-N-aa

1

<0.1