リスト・チェック

リスト・チェック・プロセッサは、属性内のデータをその属性の有効値および無効値の参照リストと照合してチェックします。

プロセッサでは、大/小文字を区別する照合または大/小文字を区別しない照合を実行でき、様々な方法で参照リストと照合できます。

  • 次を含む(値が照合リストのエントリを含んでいる必要があります)

  • 全体の値(値がリストと正確に一致する必要があります)

  • 次で始まる(値が照合リストのエントリで始まる必要があります)

  • 後方から一致する(値が照合リストのエントリで終わる必要があります)

  • 区切り文字の一致(指定した区切り文字を使用して照合前にデータが区切られます)

注意:

リスト・チェック・プロセッサでは、有効値または無効値の外部参照データの使用はサポートされていません。これを行おうとすると、処理時にエラー・メッセージが表示されます。

リスト・チェック・プロセッサは重要なプロセッサであり、データ属性内の有効値および無効値を検出するために監査で使用されます。頻度プロファイラまたはフレーズ・プロファイラを使用して有効値と無効値のリストを作成し、それらをリスト・チェックで使用して、リストに基づいてデータを継続的に監査します。

リスト・チェックでは、参照リストを2つまで(属性の有効値のリストと無効値のリスト)使用できます。

この2つのリストのうち1つのみを使用することもできます。たとえば、プロファイリングによって1つの属性に多くの異なる有効値があることがわかった場合は、属性の無効値のみをチェックし、一致しない値を有効または不明とみなすことができます。たとえば、Surname属性で単に「Test」などの疑わしい単語を検索するという方法がとれます。

ただし、属性の有効値の数が少ない場合は、単にデータを有効値のリストと照合してチェックし、一致しない値を無効または不明とみなすことができます。たとえば、Titleの値を有効な敬称の小規模なセットと照合してチェックできます。

最後に、両方のリストを使用して、有効値と無効値の両方を認識し、いずれのリストとも一致しない値を不明に分類できます。

次の表に、構成オプションを示します。

構成 説明

入力

有効または無効な値(あるいはその両方)のリストに基づいてチェックする任意のタイプ(文字列、日付、数値、文字配列、日付配列、番号配列)の1つ以上の属性を指定します。

オプション

有効値に対してチェックするための次のオプションを指定します。

  • 有効値参照データ: 属性の有効値のリスト。参照データとして指定します(外部参照データの使用はサポートされません)。デフォルト値: None

  • 不一致を次のように分類: 有効値のリストと一致しない値の分類方法。選択して指定します(不明/無効)。デフォルト値: 不明

無効値に対してチェックするための次のオプションを指定します。

  • 無効値参照データ: 属性の無効値のリスト。参照データとして指定します(外部参照データの使用はサポートされません)。デフォルト値: None

  • 不一致を次のように分類: 無効値のリストと一致しない値の分類方法。選択して指定します(不明/有効)。デフォルト値: 不明

次の照合オプションを指定します。

  • 大文字/小文字を区別しない: リストを照合するときに、大/小文字の別を無視するかどうかを決定します。使用可能な値: はい/いいえ。デフォルト値: はい

  • リストの一致基準: リストとの照合方法を決定します。選択して指定します(全体の値/次を含む/先頭から一致する/後方から一致する/区切り文字の一致)。デフォルト値: 全体の値

  • 区切り文字: 区切り文字を使用してデータを区切ってから値をリストと照合する場合は(「区切り文字の一致」)、使用する区切り文字をこのフィールドで指定できます。フリー・テキスト・エントリとして指定します。デフォルト値: [space]

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

なし。

フラグ

次のフラグが出力されます。

  • ListValid: どのデータがリスト・チェックに合格したかを示します。値「-」は結果が不明だったことを意味します。使用可能な値はY/N/-です。

次の表に、このプロファイラによって生成される統計情報を示します。

統計 説明

有効レコード

リスト・チェックで有効と分類されたレコード。

不明レコード

リスト・チェックで不明と分類されたレコード。

無効レコード

リスト・チェックで無効と分類されたレコード。

結果をドリルダウンすると、レコード自体を表示できます。

出力フィルタ

リスト・チェックからは、次の出力フィルタを使用できます。

  • 有効レコード

  • 不明レコード

  • 無効レコード

この例では、リスト・チェックを使用して、頻度プロファイリングから生成されたBusiness属性の有効値と無効値のリストを使用して、Business属性内の値をチェックしています。

いずれのリストとも一致しない値は不明と分類されることに注意してください。

サマリー・ビュー:

有効レコード 不明レコード 無効レコード

1665

332

4

不明レコードのドリルダウン:

カウント %

[Null]

331

16.5

フィールド

1

<0.1

無効レコードのドリルダウン:

カウント %

テスト

3

0.1

Test Ltd

1

<0.1