「First Non-Empty Value」出力セレクタでは、マージ対象のレコードを検索し、検出された空でない最初の値を出力属性の値として選択します。複数のデータ・ソースから入力レコードをマージする場合、マージされる値の優先ソースを指定するために、レコードが検査される順序を指定できます。
「First Non-Empty Value」出力セレクタは、特定のデータ・ソースの値を他のデータ・ソースより優先する場合に使用します。たとえば、レコードを拡張するときに、参照データ表の値(空でない場合)を優先して使用する場合です。作業データの値が出力セレクタに入力されており、参照データ表の属性の値が空の場合は、作業データの値のみが選択されます。
また、特定のビジネス・ルールを使用してデータを選択する方法がなく、出力を手動でレビューして値が正しいことをチェックする必要がある場合は、「First Non-Empty Value」セレクタを使用して、各出力属性のデフォルト出力値を選択することもできます。これにより、必要な出力を解決するための時間を短縮できます。
1つのデータ・ソースを使用し、各グループに複数のレコードが含まれる場合、「First Non-Empty Value」セレクタでは、数値属性の場合は最低値、日付属性の場合は最早日付、文字列属性の場合はアルファベット順にソートされた最初の値が選択されます。これにより、同じマッチ・プロセスが繰返し実行されても、出力選択の決定が一定になります。
入力データ・セットからの任意のタイプの属性。
なし。出力選択には、入力属性の順序が重要です。属性を順番に入力すると、選択では1番目の属性が優先され、1番目の属性に値がない場合のみ2番目の属性が使用されます。
この例では、信頼できる参照データ・ストリームから顧客の住所データを拡張する際に、「First Non-Empty Value」出力セレクタを使用して「PostCode」属性の値を選択します。参照データ・ストリームが使用可能な場合は、ここから郵便番号を選択します。使用不可の場合は、作業データ内の元の郵便番号値を保持します。この場合、両方の「PostCode」属性を入力しますが、出力セレクタは参照データ・ストリームを最初に使用します。
出力例
次の表に、前述のように構成済の「First Non-Empty Value」セレクタを使用した出力の例を示します。
参照データ・ストリームからの入力値 |
作業データ・ストリームからの入力値 |
出力値 |
CB4 1UW |
CB4 1YW |
CB4 1UW |
CB4 3DD |
CB4 3DD |
CB4 3DD |
CB4 0WS |
null |
CB4 0WS |
null |
SW11 5QB |
SW11 5QB |
null |
null |
null(後述の注意を参照) |
注意: 出力でnull値が選択されたとき、出力属性に対して「Allow NULLs」設定の選択が解除されている場合のみ選択エラーとみなされます。そうでない場合、null値の選択は正しいとみなされます。 |
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.