出力セレクタ: 最も一般的な値

「最も一般的な値」出力セレクタでは、マージ対象の全レコードの入力属性値から、最も一般的な値を出力属性として選択します。

「最も一般的な値」出力セレクタは、マージ対象のレコードで最もよく出現する値が属性の出力値に最適であることが多い場合に使用します。

「最も一般的な値」セレクタは、複数のレコードをマージするとき、最も一般的な値以外には意味のある定義がない場合に最も役立ちます。たとえば、Name属性の重複を除去して値を選択するとき、「John Lewis」と「John Louis」の最も一般的な値は判断できません。しかし、「John Lewis」、「John Lewis」、「John Louis」の最も一般的な値は簡単に判断できます。

また、このセレクタは、2つのレコードをマージするとき、レコード間で値が異なるために手動による選択が必要な場合に、選択エラーを発生させるためにも使用できます。

「最も一般的な値」セレクタは、Null値とデータを含む値から選択するときに、Null値を無視することに注意してください。ただし、すべての値がNull値の場合は、Null値を出力値として選択します。「Nullの許可」オプションを使用して、Null値が選択された場合にエラーを発生するかどうかを制御します。

次の表に、構成オプションを示します。

構成 説明

入力

入力データ・セットからの任意のタイプの属性。

オプション

次のオプションを指定します。

  • 関連付けられている場合、空でない値を最初に使用: このオプションを使用すると、他の値より多く出現する値がない場合に、自動的に値が選択されます。

    文字列値の場合はアルファベット順にソートされた最初の値、数値の場合は最低値、日付の場合は最早値が選択されます。

    タイプ: はい/いいえ。デフォルト値: はい。

この例では、「最も一般的な値」出力セレクタを使用して、各一致グループの全レコードからSurname属性の値を選択します。

サンプル構成

関連付けられている場合、空でない最初の値 = いいえ

出力例

次の表に、「最も一般的な値」セレクタを使用した出力の例を示します。

表1-108 「最も一般的な値」セレクタを使用した出力の例

レコードA レコードB レコードC 出力値(最も一般的な値)

Lewis

Lewis

Null

Lewis

Lewis

Lewis

Louis

Lewis

Francis

Frances

Null

選択エラー(手動による解決が必要)

Francis

Frances

Franciss

選択エラー(手動による解決が必要)

Lewis

Null

Null

Lewis

Null

Null

Null

Null