1.3.10.16 値の抽出
「値の抽出」プロセッサは、参照リストと一致した値または値の一部を新しい属性に抽出します。
リストとの照合は、次の5つのいずれかの方法で実行できます。
-
全体の値
-
次で始まる
-
次で終わる
-
次を含む
-
区切り文字の一致
これは、値が抽出される方法を制御します。たとえば、会社名属性からビジネス接尾辞を抽出する場合は、リストの値で終了している場合にのみ値を抽出します。
「値の抽出」は、個別に処理する必要がある入力属性の明確な部分が格納された新しい属性を作成する場合に使用します。
たとえば、製品の単位を表す値(PINTS、PNTS、PTSなど)が含まれているProduct_Description
属性がある場合は、これらの値を個別の属性に抽出できます。
次の表に、構成オプションを示します。
構成 | 説明 |
---|---|
入力 |
リストと一致する値を抽出する1つ以上の文字列または文字配列属性を指定します。 |
オプション |
次の「値マップ」オプションを指定します。
次の照合オプションを指定します。
|
出力 |
データ属性またはフラグ属性の出力を記述します。 |
データ属性 |
次のデータ属性が出力されます。
|
フラグ |
次のフラグが出力されます。
|
次の表に、このプロファイラによって生成される統計情報を示します。
統計 | 説明 |
---|---|
抽出済 |
リストと一致したために抽出が実行されたレコードの数。 |
未抽出 |
リストと一致しなかったために抽出が実行されなかったレコードの数。 |
出力フィルタ
次の出力フィルタを使用できます。
-
リストと一致したレコード
-
リストと一致しなかったレコード
例
この例では、通常は郡のみが格納され、一部に郡とその他の追跡情報(郵便番号など)の両方が格納されることがあるADDRESS3
属性から郡の値を「値の抽出」を使用して抽出します。この場合、「次で始まる」オプションを使用してリストを照合し、一致する値をCountyという出力属性に抽出します。
ADDRESS3.trimmed | 郡 |
---|---|
Cheshire |
Cheshire |
Kent |
Kent |
Surrey, CB0 8YN |
Surrey |
Herts, AL1 3HL |
Herts |
Cambridgeshire |
Cambridgeshire |
Essex, SS2 5QN |
Essex |
London, WC2E 8JG |
London |