比較: 文字の一致率
「文字の一致率」比較では、2つの文字列値の文字編集距離を計算し、2つの値の長い方または短い方の長さ(文字数)を考慮して、2つの値(文字列、文字配列)が相互にどの程度一致しているかを判断します。
値が可変長(名前など)で元の値にスペル・ミスが存在する可能性のある場合に、「文字の一致率」比較を使用して一致を検索します。たとえば、会社名を照合する際、値「ABC」と「BBC」の文字編集距離は1で、他の比較では近似一致とみなされます。しかし、文字の一致率は66%にすぎません。これに対して、同じように文字編集距離が1の「Oracle」と「Oracles」の文字の一致率は90%で、高い一致率を示しています。
この比較では、結果バンドの使用がサポートされています。
次の表に、構成オプションを示します。
オプション | タイプ | 説明 | デフォルト値 |
---|---|---|---|
データなしのペアを照合 |
はい/いいえ |
このオプションは、識別子の2つのデータなし(Null、または空白文字のみを含む)値を比較した際に、比較結果を判断します。 「いいえ」に設定した場合、データなし値と別のデータなし値を比較した際、「データなし」の比較結果が返されます。 「はい」に設定した場合、データなし値と別のデータなし値を比較した際、完全一致(文字の一致率は100%)の比較結果が返されます。「データなし」結果が返されるのは、データなし値と移入値を比較した場合のみです。 |
いいえ |
大文字/小文字を区別しない |
はい/いいえ |
値を比較する際に、大文字/小文字を区別しないかどうかを設定します。 たとえば、大文字/小文字を区別しない場合、「Oracle Corporation」と「ORACLE CORPORATION」は文字の一致率が100%で一致します。 |
はい |
より短い入力に関連付け |
はい/いいえ |
このオプションにより、「文字の一致率」比較で行われる計算が決定されます。 「はい」に設定すると、比較する2つの入力のうち、(文字数が)短い方の入力を使用して、その文字数のパーセントとして結果が計算されます。 「いいえ」に設定すると、比較する2つの入力のうち、(文字数が)長い方の入力を使用して、その文字数のパーセントとして結果が計算されます。 |
いいえ |
例
この例では、「文字の一致率」比較を使用して会社名を照合します。次のオプションを指定します。
-
データなしのペアを照合= いいえ
-
大文字/小文字を区別しない = はい
-
より短い入力に関連付け= いいえ
次の変換が追加されます。
-
空白の切捨て。比較する前に、値からすべての空白を削除します。
-
単語の削除。*ビジネス接尾辞マップ(単語「Ltd」と「Limited」を含む)を使用します
次の表に、前述の構成を使用した比較結果の例を示します。
表1-37 結果例: 文字の一致率
値A | 値B | 比較結果 |
---|---|---|
ABC ltd |
ABC limited |
100% |
ABC ltd |
BBC |
66% |
Fast track systems |
Fastrack systems |
93% |
BT |
BTAT |
50% |
Gemini Partners |
Gemmini Partners |
93% |