値の抽出

「値の抽出」プロセッサは、参照リストと一致した値または値の一部を新しい属性に抽出します。

リストとの照合は、次の5つのいずれかの方法で実行できます。

  • 全体の値

  • 次で始まる

  • 次で終わる

  • 次を含む

  • 区切り文字の一致

これは、値が抽出される方法を制御します。たとえば、会社名属性からビジネス接尾辞を抽出する場合は、リストの値で終了している場合にのみ値を抽出します。

「値の抽出」は、個別に処理する必要がある入力属性の明確な部分が格納された新しい属性を作成する場合に使用します。

たとえば、製品の単位を表す値(PINTS、PNTS、PTSなど)が含まれているProduct_Description属性がある場合は、これらの値を個別の属性に抽出できます。

次の表に、構成オプションを示します。

構成 説明

入力

リストと一致する値を抽出する1つ以上の文字列または文字配列属性を指定します。

オプション

次の「値マップ」オプションを指定します。

  • 参照データ: 抽出する値のリスト。参照データとして指定します。デフォルト値: None

次の照合オプションを指定します。

  • 大文字/小文字を区別しない: 値をリストと照合するときに大/小文字を無視するかどうか。Specified as 「はい」/「いいえ」で指定します。デフォルト値: はい

  • リストの一致基準: リストの照合方法を決定します。選択して指定します(全体の値/先頭から一致する/後方から一致する/次を含む)。デフォルト値: 次を含む

  • 区切り文字: 区切り文字を使用してデータを区切ってから値をリストと照合する場合は、使用する区切り文字を指定できます。フリー・テキストとして指定します。デフォルト値: スペース

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

次のデータ属性が出力されます。

  • [Attribute Name].ExtractedValue: リストと一致した値の一部が抽出された新しい属性。リストに一致するものがあった場合は、リストと一致した値になります。リストに一致するものがなかった場合は、Null値になります。

フラグ

次のフラグが出力されます。

  • ExtractedFlag: データが抽出されたかどうかを示します。使用可能な値: Y/N

次の表に、このプロファイラによって生成される統計情報を示します。

統計 説明

抽出済

リストと一致したために抽出が実行されたレコードの数。

未抽出

リストと一致しなかったために抽出が実行されなかったレコードの数。

出力フィルタ

次の出力フィルタを使用できます。

  • リストと一致したレコード

  • リストと一致しなかったレコード

この例では、通常は郡のみが格納され、一部に郡とその他の追跡情報(郵便番号など)の両方が格納されることがあるADDRESS3属性から郡の値を「値の抽出」を使用して抽出します。この場合、「次で始まる」オプションを使用してリストを照合し、一致する値をCountyという出力属性に抽出します。

ADDRESS3.trimmed

Cheshire

Cheshire

Kent

Kent

Surrey, CB0 8YN

Surrey

Herts, AL1 3HL

Herts

Cambridgeshire

Cambridgeshire

Essex, SS2 5QN

Essex

London, WC2E 8JG

London