Metaphone |
「Metaphone」プロセッサでは、Double Metaphoneアルゴリズムを使用して、文字列属性の値を元の文字列の音声発音を表すコードに変換します。
Double Metaphoneアルゴリズムは、「Soundex」(特に個人名に対応できるように設計されている)より一般的な発音技術で、元のMetaphoneアルゴリズムより精巧で状況依存に対応しています。
注意: わかりやすくするために、このドキュメントでは、これ以降、「Metaphoneコード」とします。ただし、「Double Metaphoneアルゴリズム」は全体を通して使用します。 |
Metaphoneコードは、たとえば、情報を電話で取得した場合など、同じ発音の単語でスペルの相違が発生する可能性がある場合に特に役立ちます。正確な文字列値のかわりに、文字列の発音を考慮することで、軽微な差異の多くを克服できます。したがって、Metaphoneコードは、重複チェックを実行する際に生のデータ値にかわる優れたコードであり、重複の可能性がある値または等価値を簡単に識別できるようになります。
列全体ではなく最初の数音節または複合データの最初の数単語のみに集中したり、双方の値の発音類似性の厳密度を制御できるように、このプロセッサではMetaphoneコードの最大長を指定できます(最大12文字)。
文字列または文字列配列属性。
配列属性を入力すると、変換はすべての配列要素に適用され、単一の配列属性が出力されます。
オプション |
タイプ |
目的 |
デフォルト値 |
Maximum result length |
数値(1から12) |
作成されるMetaphoneコードの最大長を変更できます。 |
12 |
データ属性 |
タイプ |
目的 |
値 |
[Attribute Name].Metaphone |
導出 |
入力属性から導出されたMetaphoneコードが設定された新しい属性。 |
元の属性がそのMetaphoneコードに変換された値。 |
なし
実行モード |
サポート |
バッチ |
Yes |
リアルタイム・モニタリング |
Yes |
リアルタイム応答 |
Yes |
「Metaphone」変換プロセッサでは、処理に関するサマリー統計は表示されません。
データ・ビューには、各入力属性とともに、右側に新しく導出されたMetaphone属性が表示されます。
なし。入力されたすべてのレコードが出力されます。
この例では、「Metaphone」プロセッサを使用して、サービス管理データ例から顧客表の「NAME」属性を変換します。ここでは、デフォルトの最大長である12文字を使用されます。
「James WYLIE」と「James WYLLIE」に同じMetaphoneコードが設定されていることに注意してください。
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.