Metaphone

「Metaphone」プロセッサは、Double Metaphoneアルゴリズムを使用して、文字列属性の値を元の文字列の音声発音を表すコードに変換します。

Double Metaphoneアルゴリズムは、(特に個人名に対応できるように設計されている) Soundexより一般的な発音技術で、元のMetaphoneアルゴリズムより精巧で状況依存に対応しています。

注意:

このドキュメントでは、これ以降、「Metaphoneコード」とします。ただし、Double Metaphoneアルゴリズムは全体を通して使用します。

Metaphoneコードは、たとえば、情報を電話で取得した場合など、同じ発音の単語でスペルの相違が発生する可能性がある場合に特に役立ちます。正確な文字列値のかわりに、文字列の発音を考慮することで、軽微な差異の多くを克服できます。したがって、Metaphoneコードは、重複チェックを実行する際に生のデータ値にかわる優れたコードであり、重複の可能性がある値または等価値を簡単に識別できるようになります。

このプロセッサを使用すると、Metaphoneコードの最大長(最大12文字)を指定することにより、列全体ではなく最初の数音節または複合データの最初の数単語のみに集中したり、双方の値の発音類似性の厳密度を制御できるようになります。

次の表に、構成オプションを示します。

構成 説明

入力

文字列または文字列配列属性を指定します。

配列属性を入力すると、変換はすべての配列要素に適用され、1つの配列属性が出力されます。

オプション

次のオプションを指定します。

  • 最大結果長: 生成されるMetaphoneコードの最大長を変更できます。1から12までの数値で指定します。デフォルト値: 12

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

次のデータ属性が出力されます。

  • [Attribute Name].Metaphone: 入力属性から導出されたMetaphoneコードが設定された新しい属性。値は、元の属性値をそのMetaphoneコードに変換して導出されます。

フラグ

なし。

「Metaphone」変換プロセッサでは、処理に関するサマリー統計は表示されません。

データ・ビューには、各入力属性とともに、右側に新しく導出されたMetaphone属性が表示されます。

出力フィルタ

なし。入力されたすべてのレコードが出力されます。

この例では、「Metaphone」プロセッサを使用して、サービス管理データ例から顧客表のNAME属性を変換します。この場合、デフォルトの最大長である12文字が使用されました。

NAME (昇順) NAME.Metaphone

James TODTENHAUPT

JMSTTNPT

James WYLIE

JMSL

James WYLLIE

JMSL

Jane MCCULLOCH

JNMKLK

Jane MCLACHAN

JNMKLKN

Jane MCWILLAIM

JNMKLM

Jane MILLIGAN

JNMLKN

James WYLIEとJames WYLLIEに同じMetaphoneコードが設定されていることに注意してください。