短縮プロセッサ

短縮プロセッサは製品説明文字列からIDのような値を作成するよう設計されており、テキスト文字列の一般的な短縮にも使用できます。単一の文字列が入力されるとそれを様々なオプションに基づいて短縮し、単一の文字列を出力します。

表10-1 入力属性

属性名 データ型 説明 必須

入力文字列

文字列

短縮する入力

Y

表10-2 出力属性

属性名 データ型 説明

Input.Abbreviated

文字列

短縮された入力

表10-3 オプション

オプション名 データ型 デフォルト 説明

短縮前に置換する文字

参照データ

短縮 – 置換する文字

短縮前に置換する個々の文字。PDSのデフォルト参照データには、アクセント記号付き文字を標準化し、特定の記号をスペースで置き換えるためのデータが含まれます。

短縮前に削除する文字

参照データ

短縮 – 削除する文字

短縮前に削除する文字。デフォルト参照データでは発音区別記号およびその他の記号が削除されます。

短縮前に置換する単語

参照データ

短縮 – 単語の置換

短縮前に置換する個々の単語。

単語の途中または末尾の母音を削除しますか?(Y/N)

文字列

Y

単語の途中または末尾の母音を削除するかどうか。(最小ワード長の設定に基づく)十分な長さがあり、かつ数字が含まれないトークンに対してのみ適用されます。

単語の先頭の母音を削除しますか?(Y/N)

文字列

N

単語の先頭の母音を削除するかどうか。(最小ワード長の設定に基づく)十分な長さがあり、かつ数字が含まれないトークンに対してのみ適用されます。

二重の子音を一重に置換しますか?(Y/N)

文字列

Y

二重の子音を一重に置換するかどうか。(最小ワード長に基づく)十分な長さ設定があり、かつ数字が含まれないトークンに対してのみ適用されます。

数字を含むトークンの短縮(Y/N)

文字列

N

短縮オプションを、数字を含むトークンに適用するかどうか。

この長さの単語は短縮しない

整数

<空白>

短縮オプション(前述の最初の3つのオプション)が適用されるトークンの最小長。

この文字数を超える単語を切捨て(短縮後

整数

<空白>

他のオプションに基づいて処理された後のトークンの最大長。この長さより長いトークンはこの長さに切り捨てられます(切り捨てられる文字は末尾から削除されます)。

単語を標準化

参照データ

<空白>

短縮する前(ただし単純な標準化/正規化処理の後)に単語を置き換えるための参照データ。

出力単語のセパレータ

文字列

<空白>

出力文字列のトークン間に出力されるセパレータ。

表10-4 例

入力 先頭の母音を削除 中間/最後の母音を削除 二重の子音を置換 数値のあるトークンを短縮 最大トークン長 最小トークン長 出力デリミタ 出力

Sony Bravvia LCD TV, 47", Silver, Abacus

N

Y

Y

N

<空白>

<空白>

|

SNY|BRV|LCD|TV|47|SLVR|ABCS

TTB653SDS Hexarmor Sharpsmaster HV 7082 Needlestick-Resistant

N

Y

Y

N

8

<空白>

|

TTB653SDS|HXRMR|SHRPSMST|HV|7082|NDLSTCKR|GLVS