比較: 文字編集距離
「文字編集距離」比較では、2つの文字列/文字配列の値を比較し、値をもう一方の値に変換するために必要な文字編集(削除、挿入および置換)の最小回数を計算して、相互にどの程度一致しているかを判断します。
「文字編集距離」比較は、比較に使用される最も強力で汎用的な比較の1つです。「文字編集距離」比較を使用して、識別子の2つの値について完全一致または近似一致を検索します。「文字編集距離」比較は、スペルミスのために相互に1文字または2文字の差異があるテキスト値の照合に適しています。たとえば、「Matthews」と「Mathews」の編集距離は1です。
この比較では、結果バンドの使用がサポートされています。
次の表に、構成オプションを示します。
オプション | タイプ | 説明 | デフォルト値 |
---|---|---|---|
データなしのペアを照合 |
はい/いいえ |
このオプションは、識別子の2つのデータなし(Null、または空白文字のみを含む)値を比較した際に、比較結果を判断します。 「いいえ」に設定した場合、データなし値と別のデータなし値を比較した際、「データなし」の比較結果が返されます。 「はい」に設定した場合、データなし値と別のデータなし値を比較した際、完全一致(文字編集距離が0)の比較結果が返されます。「データなし」結果が返されるのは、データなし値と移入値を比較した場合のみです。 |
いいえ |
大文字/小文字を区別しない |
はい/いいえ |
値を比較する際に、大文字/小文字を区別しないかどうかを設定します。 たとえば、大文字/小文字を区別しない場合、「Oracle Corporation」と「ORACLE CORPORATION」は文字編集距離0で一致します。 |
はい |
例
この例では、「文字編集距離」比較を使用して電子メール・アドレスを照合します。次のオプションを指定します。
表1-35 オプション例: 文字編集距離
オプション | 設定 |
---|---|
データなしのペアを照合 |
いいえ |
大文字/小文字を区別しない |
はい |
結果例:
表1-36 結果例: 文字編集距離
値A | 値B | 比較結果 |
---|---|---|
john/smith@example.com |
john.smith@example.com |
1 |
John.Smith@example.com |
john.smith@example.com |
0 |
jhon_smith@hotmail.com |
john_smith@hotmail.com |
2 |
tom simpson@gmail.com |
tomsimpson@gmail.com |
1 |
andrew_johnson@email.net |
andrew.johnstone@email.net |
3 |
<null> |
andrew.johnstone@email.net |
データなし |
<null> |
<null> |
データなし |