マッチ: Soundex

「Soundex」変換では、スペルミスなどのために同じではないが、音声は同じである値から、共通のsoundexキーを作成します。

「Soundex」変換は「Metaphone」変換に似ていますが、2つの値の音声が同じかどうかを判断する方法が異なります。通常、この変換は、同じキーが生成されるために2つの値の音声がどの程度似ている必要があるか、という基準が緩やかです。たとえば、「Smith」と「Snaith」は同じキーが生成されますが、metaphoneキーは異なります。

また、「Soundex」変換は、1単語(複数の単語で構成される値を処理する場合は、最初の単語)のみに対して機能することも重要です。これは、「Margaret Hawkins」と「Margaret Johnson」は同じsoundexキー(M626)が生成されますが、metaphoneキーは異なることを意味します。

用途

「Soundex」変換は、1単語の名称識別子(「First Name」(名)、「Surname」(姓)など)に対してクラスタリングまたは照合する場合に役立ちます。これは、主要識別子(名称など)にスペルミスが多く発生し、同じである可能性がある名称をマッチ・ルールによって取得する必要がある場合に使用します。

オプション

なし

この例では、小さいデータセットの初期クラスタを作成するために、「Soundex」変換を使用して、「Surname」識別子の値をsoundexキーに変換します。

変換例

次の表に、「Soundex」変換の例を示します。

変換された値

Howard

H630

Hayward

H630

Hardy

H630

Price

P620

Pierce

P620

Preece

P620

Pryke

P620

Roberts

R163

Robertson

R163

Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.