「Character Edit Distance」比較では、2つの文字列値を比較し、値をもう一方の値に変換するのに必要な文字編集(削除、挿入および置換)の最小回数を計算して、相互にどの程度一致しているかを判断します。
「Character Edit Distance」比較は、最も強力で汎用的な比較の1つです。「Character Edit Distance」比較を使用して、識別子の2つの値について完全一致または近似一致を検索します。「Character Edit Distance」比較は、スペルミスのために相互に1文字または2文字の差異があるテキスト値の照合に適しています。たとえば、「Matthews」と「Mathews」の編集距離は1です。
この比較では、結果バンドの使用がサポートされています。
オプション |
タイプ |
目的 |
デフォルト値 |
Match No Data pairs? |
Yes/No |
このオプションは、識別子の2つの非データ(Null、または空白文字のみを含む)値を比較する際の比較の結果を決定します。 「No」に設定した場合、非データ値に対して別の非データ値を比較すると、比較は「no data」結果になります。 「Yes」に設定した場合、非データ値に対して別の非データ値を比較すると、比較は完全一致(文字編集距離が0)になります。移入された値に対して非データ値を比較した場合、返されるのは「no data」結果のみです。 |
No |
Ignore case? |
Yes/No |
値を比較するときに、大/小文字を無視するかどうかを設定します。 たとえば、大/小文字を無視する場合、「Oracle Corporation」と「ORACLE CORPORATION」は文字編集距離0で一致します。 |
Yes |
構成例
この例では、「Character Edit Distance」比較を使用してEメール・アドレスを照合します。次のオプションを指定します。
Match No Data pairs?= No
Ignore case?= Yes
結果例
次の表に、前述の構成を使用した比較結果の例を示します。
値A |
値B |
比較結果 (文字編集距離) |
john/smith@oracle.com |
john.smith@oracle.com |
1 |
John.Smith@oracle.com |
john.smith@oracle.com |
0 |
jhon_smith@hotmail.com |
john_smith@hotmail.com |
2 |
tom simpson@gmail.com |
tomsimpson@gmail.com |
1 |
andrew_johnson@email.net |
andrew.johnstone@email.net |
3 |
<null> |
andrew.johnstone@email.net |
no data |
<null> |
<null> |
no data |
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.