「Most Common Value」出力セレクタでは、マージ対象の全レコードの入力属性値から、最多値を出力属性として選択します。
「Most Common Value」出力セレクタは、マージ対象のレコードで最も多い値が属性の出力値に最適であることが多い場合に使用します。
「Most Common Value」セレクタは、複数のレコードをマージするとき、最多値以外には意味のある定義がない場合に最も役立ちます。たとえば、「Name」属性の重複を除去して値を選択するとき、「John Lewis」と「John Louis」の最多値は判断できません。これに対して、「John Lewis」、「John Lewis」、「John Louis」の最多値は簡単に判断できます。
また、このセレクタは、2つのレコードをマージするとき、レコード間で値が異なるために手動による選択が必要な場合に、選択エラーを発生させるためにも使用できます。
「Most Common Value」セレクタは、Null値とデータを含む値から選択するときに、Null値を無視することに注意してください。ただし、すべての値がNull値の場合は、Null値を出力値として選択します。「Allow Nulls」オプションを使用して、Null値が選択された場合にエラーを発生するかどうかを制御します。
入力データ・セットからの任意のタイプの属性。
オプション |
タイプ |
目的 |
デフォルト値 |
Yes/No |
このオプションを使用すると、他の値より多く出現する値がない場合に、自動的に値が選択されます。 文字列値の場合はアルファベット順にソートされた最初の値、数値の場合は最低値、日付の場合は最早値が選択されます。 |
Yes |
この例では、「Most Common Value」出力セレクタを使用して、各マッチ・グループの全レコードから「Surname」(姓)属性の値を選択します。
構成例
First Non-Empty Value if Tied = No
出力例
次の表に、「Most Common Value」セレクタを使用した出力の例を示します。
レコードA |
レコードB |
レコードC |
出力値 (最多値) |
Lewis |
Lewis |
Null |
Lewis |
Lewis |
Lewis |
Louis |
Lewis |
Francis |
Frances |
Null |
選択エラー(手動による解決が必要) |
Francis |
Frances |
Franciss |
選択エラー(手動による解決が必要) |
Lewis |
Null |
Null |
Lewis |
Null |
Null |
Null |
Null |
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.