1.3.3.8.13 比較: 最長共通部分文字列
「最長共通部分文字列」比較では、2つの文字列/文字配列の値を比較し、両方の値に共通する文字の連続(部分文字列、その部分文字列が文字列値の全部か一部かに関係なく)の最大長を判断することにより、2つの値が一致しているかどうかを判断します。
文字列の先頭または末尾に、単語の削除による比較では無視するのが困難なノイズがある場合、または、特定の長さを超える文字の共通する連続が文字列値に含まれ、それらが関連付けられている場合は、「最長共通部分文字列」比較を使用して、文字列値間の一致を検索します。たとえば、「Nomura Securities Co., Ltd.」と「Nomura Investor Relations Co., Ltd.」を照合すると、最長共通部分文字列は「Nomura」の6文字です。
多くの場合、「最長共通部分文字列」比較をデシジョン表内の下位の一致ルールで使用すると、類似性はあるが他のルールを使用すると一致にならない(たとえば、語順の問題や余分なノイズのため)一致候補を検索してレビューできます。
この比較では、結果バンドの使用がサポートされています。
次の表に、構成オプションを示します。
オプション | タイプ | 説明 | デフォルト値 |
---|---|---|---|
データなしのペアを照合 |
はい/いいえ |
このオプションは、識別子の2つのデータなし(Null、または空白文字のみを含む)値を比較した際に、比較結果を判断します。 「いいえ」に設定した場合、データなし値と別のデータなし値を比較した際、「データなし」の比較結果が返されます。 「はい」に設定した場合、データなし値と別のデータなし値を比較した際、0の比較結果が返されます。「データなし」結果が返されるのは、データなし値と移入値を比較した場合のみです。 |
いいえ |
大文字/小文字を区別しない |
はい/いいえ |
値を比較する際に、大文字/小文字を区別しないかどうかを設定します。 |
はい |
例
この例では、「最長共通部分文字列」比較を使用して、顧客名の一致候補を識別します。
次のオプションを指定します。
-
データなしのペアを照合= いいえ
-
大文字/小文字を区別しない = はい
「空白の切捨て」変換を使用して、値を比較する前に値からすべての空白を削除します。
結果例
次の表に、前述の構成を使用した比較結果をいくつか示します。
表1-50 結果例: 最長共通部分文字列
値A | 値B | 比較結果 |
---|---|---|
Jill Lewis |
Jill Lewis-Thompson |
9 |
Jill Lewis |
Bill Lewis |
8 |
Jill Lewis |
Jill Lonerghan |
5 |
Michael Davis **DO NOT CALL** |
Michael Davis |
12 |
Tom Featherstone ----DECEASED---- |
Thomas David Featherstone |
12 |
Tom Featherstone |
John Feathers |
8 |