1.3.3.9.8 照合変換: 最初のN文字
「最初のN文字」変換を使用すると、照合で比較を実行する際に、値の左側から読み取った文字数(N)にまで値を削除することにより、値の末尾を無視できます。
これは、値の最初の数文字にまで切り捨てるメインの文字の切捨てプロセッサを使用する場合と似ています。
「最初のN文字」変換は、識別子の最初の数文字を使用してクラスタリングする場合や、値の末尾がノイズ文字である識別子に対して照合を行う場合に使用します。多くの場合、これは、識別子のキー部分は同じであるが、残りの部分はまったく違うために、他の比較を使用して見つけることが困難な一致候補を見つける目的で、セカンダリ照合ルールで「文字列の完全一致」比較(「比較: 文字列の完全一致」を参照)により使用されます。たとえば、住所を照合する際、住所の1行目の最初の8文字が同じである場合、一方の値のデータに含まれるデータ量がもう一方よりもはるかに多かったとしても、一致の可能性は非常に高くなります。
次の表に、構成オプションを示します。
構成 | 説明 |
---|---|
オプション |
次のオプションを指定します。
|
ノート:
スペースや改行などの空白文字が値に含まれる場合は、他の文字と同様に文字としてカウントされます。データ文字を選択していることを確認するために、「空白の切捨て」変換を使用してからこの変換を使用することもできます。
サンプル構成
この例では、「最初のN文字」変換を使用して、住所の1行目を照合します(1行目の一部に建物名より多くの情報が含まれることがわかっています)。
文字数: 8
無視する文字: 0
変換例
次の表に、前述の構成を使用した変換の例を示します。
表1-80 「最初のN文字」変換の例
値 | 変換済の値 |
---|---|
Homesteads, 145 Herring Way |
Homestea |
Homesteads |
Homestea |
135 Burbage Road, Minster, MI5 6DF |
135 Burb |
135 Burbage Road |
135 Burb |