照合変換: Metaphone

「Metaphone」変換は、発音が同じでもスペルミスなどが原因で異なる可能性のある値から共通のmetaphoneキーを作成します。

「Metaphone」変換は、クラスタリングや比較を実行する際、特に、名前などのスペルミスを含む可能性のあるデータを照合する場合に非常に便利です。

クラスタリングの際に、発音が同じ識別子を持つすべての値のグループを作成することによってレコードをクラスタ・グループに分割する便利な方法が提供されます。たとえば、姓「Gold」、「Gould」および「Gauld」すべてから同じmetaphoneキー(KLT)が生成されます。

比較を使用する場合、一致ルールを強化するために確定metaphone一致を含めると効果的なことがよくあります。たとえば、名前フィールドに対する編集距離が2文字または3文字の場合は非常に低い一致であっても、両方の値の発音が同じであれば、これによって一致を強化できます。たとえば、「John Clarke」は「Jon Clarke」と同一人物である可能性はありますが、「John Darke」と同一人物である可能性はそれよりはるかに低くなります。

これは、多くは名前を正しく聞き取らずにデータを入力したために発生したスペルミスを見つける方法を提供します。

次の表に、構成オプションを示します。

構成 説明

オプション

次のオプションを指定します。

  • 返される最大metaphone長: metaphone変換の厳密度を調整できます。値が短いと、値の末尾付近の発音に違いのある長い値に対しても同じキーが生成されることを示します。タイプ: 整数デフォルト値: 12。

この例では、「Metaphone」変換を使用して名前の一致を強化します。変換済の値に対して「文字列の完全一致」変換(「比較: 文字列の完全一致」を参照)が実行され、2つの値の発音が同じかどうかを判別する比較が形成されます。

変換例

次の表に、前述の構成を使用した変換の例を示します。

表1-87 「Metaphone」変換の例

変換済の値

Ellen Wilson

ALNLSN

Eileen Wilson

ALNLSN

Pauline Bedham

PLNPTM

Pauline Beedham

PLNPTM

Lewis

LS

Louis

LS

Lees

LS

Pearce

PRS

Pierce

PRS