Soundex

「Soundex」プロセッサでは、指定した属性の各値に対してSoundexコードを生成します。Soundexは、発音が似ている名称を同じコードとして表現する抽象キーです。Soundexは特に姓に適用できます(他の領域で使用されることもありますが注意が必要です)。

用途

Soundexコードは、同じ発音の名称でスペルまたは表記の相違が発生する場合に使用されます。Soundexコードを作成しておくと、重複チェックで生のデータ値のかわりにSoundexを頻繁に使用できます。

構成

入力

Soundexコードを作成する文字列または文字列配列属性。

配列属性を入力すると、変換はすべての配列要素に適用され、単一の配列属性が出力されます。

オプション

なし。

出力

データ属性

データ属性

タイプ

目的

[Attribute Name].Soundex

導出

各入力属性から導出されたSoundexコードが設定された新しい属性

元の属性がそのSoundexコードに変換された値。

フラグ

なし

実行

実行モード

サポート

バッチ

Yes

リアルタイム・モニタリング

Yes

リアルタイム応答

Yes

結果ブラウザの表示

「Soundex」トランスフォーマでは、処理に関するサマリー統計は表示されません。

データ・ビューには、各入力属性とともに、右側に新しく導出されたSoundex属性が表示されます。

出力フィルタ

なし。入力されたすべてのレコードが出力されます。

この例では、「Surname」属性にSoundex変換を使用します。「Surname」属性は、「Make Array from String」プロセッサを使用して属性をスペース区切りで分割することで、サービス管理データ例の顧客表にある「NAME」属性から作成し、「Select Array Element」プロセッサを使用して配列の2番目の要素を選択することで「Surname」を出力します。

ALLANとALLENなど、値が同一と考えられ、タイプミスの可能性がある場合は、同じSoundexコードが生成されます。

Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.