「Soundex」変換では、スペルミスなどのために同じではないが、音声は同じである値から、共通のsoundexキーを作成します。
「Soundex」変換は「Metaphone」変換に似ていますが、2つの値の音声が同じかどうかを判断する方法が異なります。通常、この変換は、同じキーが生成されるために2つの値の音声がどの程度似ている必要があるか、という基準が緩やかです。たとえば、「Smith」と「Snaith」は同じキーが生成されますが、metaphoneキーは異なります。
また、「Soundex」変換は、1単語(複数の単語で構成される値を処理する場合は、最初の単語)のみに対して機能することも重要です。これは、「Margaret Hawkins」と「Margaret Johnson」は同じsoundexキー(M626)が生成されますが、metaphoneキーは異なることを意味します。
「Soundex」変換は、1単語の名称識別子(「First Name」(名)、「Surname」(姓)など)に対してクラスタリングまたは照合する場合に役立ちます。これは、主要識別子(名称など)にスペルミスが多く発生し、同じである可能性がある名称をマッチ・ルールによって取得する必要がある場合に使用します。
なし
この例では、小さいデータセットの初期クラスタを作成するために、「Soundex」変換を使用して、「Surname」識別子の値をsoundexキーに変換します。
変換例
次の表に、「Soundex」変換の例を示します。
値 |
変換された値 |
Howard |
H630 |
Hayward |
H630 |
Hardy |
H630 |
Price |
P620 |
Pierce |
P620 |
Preece |
P620 |
Pryke |
P620 |
Roberts |
R163 |
Robertson |
R163 |
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.