比較: Longest Common Substring

「Longest Common Substring」比較では、2つの文字列値を比較し、両方の値に共通する文字の連続（部分文字列、その部分文字列が文字列値の全部か一部かに関係なく）の最大長を判断することにより、2つの値が一致しているかどうかを判断します。

用途

文字列の先頭または末尾に、単語の削除による比較では無視するのが困難な「ノイズ」がある場合、または、特定の長さを超える文字の共通する連続が文字列値に含まれ、それらが関連付けられている場合は、「Longest Common Substring」比較を使用して、文字列値間の一致を検索します。たとえば、「Nomura Securities Co., Ltd.」と「Nomura Investor Relations Co., Ltd.」を照合すると、最長共通部分文字列は「Nomura」の6文字です。

多くの場合、「Longest Common Substring」比較を判定表内の下位の一致ルールで使用すると、類似性はあるが他のルールを使用すると一致にならない（たとえば、語順の問題や余分なノイズのため）一致候補を検索してレビューできます。

この比較では、結果バンドの使用がサポートされています。

オプション

タイプ

目的

デフォルト値

Match No Data pairs?

Yes/No

このオプションは、識別子の2つの非データ（Null、または空白文字のみを含む）値を比較する際の比較の結果を決定します。

「No」に設定した場合、非データ値に対して別の非データ値を比較すると、比較は「no data」結果になります。

「Yes」に設定した場合、非データ値に対して別の非データ値を比較すると、比較の結果は0になります。移入された値に対して非データ値を比較した場合、返されるのは「no data」結果のみです。

Ignore case?

Yes/No

値を比較するときに、大/小文字を無視するかどうかを設定します。

Yes

例

構成例

この例では、「Longest Common Substring」比較を使用して、顧客名の一致候補を識別します。次のオプションを指定します。

Match No Data pairs?= No

Ignore case?= Yes

「Trim Whitespace」変換を使用して、値を比較する前に、すべての空白文字を値から削除します。

結果例

次の表に、前述の構成を使用した比較結果をいくつか示します。

値A	値B	比較結果（最長共通部分文字列）
Jill Lewis	Jill Lewis-Thompson	9
Jill Lewis	Bill Lewis	8
Jill Lewis	Jill Lonerghan	5
Michael Davis DO NOT CALL	Michael Davis	12
Tom Featherstone ----DECEASED----	Thomas David Featherstone	12
Tom Featherstone	John Feathers	8