比較: 文字の一致率

「文字の一致率」比較では、2つの文字列値の文字編集距離を計算し、2つの値の長い方または短い方の長さ(文字数)を考慮して、2つの値(文字列、文字配列)が相互にどの程度一致しているかを判断します。

値が可変長(名前など)で元の値にスペル・ミスが存在する可能性のある場合に、「文字の一致率」比較を使用して一致を検索します。たとえば、会社名を照合する際、値「ABC」と「BBC」の文字編集距離は1で、他の比較では近似一致とみなされます。しかし、文字の一致率は66%にすぎません。これに対して、同じように文字編集距離が1の「Oracle」と「Oracles」の文字の一致率は90%で、高い一致率を示しています。

この比較では、結果バンドの使用がサポートされています。

次の表に、構成オプションを示します。

オプション タイプ 説明 デフォルト値

データなしのペアを照合

はい/いいえ

このオプションは、識別子の2つのデータなし(Null、または空白文字のみを含む)値を比較した際に、比較結果を判断します。

「いいえ」に設定した場合、データなし値と別のデータなし値を比較した際、「データなし」の比較結果が返されます。

「はい」に設定した場合、データなし値と別のデータなし値を比較した際、完全一致(文字の一致率は100%)の比較結果が返されます。「データなし」結果が返されるのは、データなし値と移入値を比較した場合のみです。

いいえ

大文字/小文字を区別しない

はい/いいえ

値を比較する際に、大文字/小文字を区別しないかどうかを設定します。

たとえば、大文字/小文字を区別しない場合、「Oracle Corporation」と「ORACLE CORPORATION」は文字の一致率が100%で一致します。

はい

より短い入力に関連付け

はい/いいえ

このオプションにより、「文字の一致率」比較で行われる計算が決定されます。

「はい」に設定すると、比較する2つの入力のうち、(文字数が)短い方の入力を使用して、その文字数のパーセントとして結果が計算されます。

「いいえ」に設定すると、比較する2つの入力のうち、(文字数が)長い方の入力を使用して、その文字数のパーセントとして結果が計算されます。

いいえ

この例では、「文字の一致率」比較を使用して会社名を照合します。次のオプションを指定します。

  • データなしのペアを照合= いいえ

  • 大文字/小文字を区別しない = はい

  • より短い入力に関連付け= いいえ

次の変換が追加されます。

  1. 空白の切捨て。比較する前に、値からすべての空白を削除します。

  2. 単語の削除。*ビジネス接尾辞マップ(単語「Ltd」と「Limited」を含む)を使用します

次の表に、前述の構成を使用した比較結果の例を示します。

表1-37 結果例: 文字の一致率

値A 値B 比較結果

ABC ltd

ABC limited

100%

ABC ltd

BBC

66%

Fast track systems

Fastrack systems

93%

BT

BTAT

50%

Gemini Partners

Gemmini Partners

93%