リーダー

リーダーは、プロセスの開始時にデータを読み取るために使用される特別なタイプのプロセッサです。リーダーは、次のデータのソースに接続できます。

プロセスには、少なくとも1つのリーダーを含める必要がありますが、複数のソースからのデータを照合する場合は複数のリーダーを含めることができます。

用途

リーダーは、プロセスの開始時に使用され、プロセスで使用するデータのソースを選択し、作成するプロセスに固有のデータ・ソースからデータ属性を選択して順序変更できます。たとえば、特定のプロセス用にデータ・ソースから氏名フィールドと住所フィールドのみを選択し、プロセス全体でフィールドを表示する際の順序を変更できます。

プロセスには少なくとも1つのリーダーを含める必要があるため、1つのリーダーがプロセスに自動的に追加されます。

構成

リーダーのソース

次のオプションから、読み取るデータのタイプを選択します。

注意: スナップショットは、必ずしもリポジトリ内に存在する必要はありません。プロセスをストリーミング・モードで実行する場合、ソース・データはリポジトリにコピーされません。

選択したタイプの使用可能なソースから、データのソースを選択します。

データ内の使用可能なすべての属性が左ペインに表示されます。属性を選択または選択を解除するための矢印ボタンを使用して、プロセスで使用する属性を選択します。

を使用して、左ペインで選択した属性をプロセスに対する入力として選択します。

を使用して、使用可能なすべての属性を入力として選択します。

を使用して、右ペインで選択した入力の選択を解除します。

を使用して、すべての入力の選択を解除します。

右ペインでは、ドラッグ・アンド・ドロップを使用して、対象として選択した属性の順序を変更できます。

リーダーに指定した順序は、プロセス全体で結果を表示する際に使用されます。

注意: 指定のデータ・セットの属性をすべて使用するわけではない場合は、使用しない属性をリーダーで除外することをお薦めします。これにより、関心のある属性のみが表示されるため、プロセッサの構成や結果の参照が簡単になります。

複数のリーダーを使用するようにプロセスを構成する場合は、データ・ストリーム名を変更することもできます。プロセスに複数のストリームがある場合(複数のソース間で照合する場合など)は、データ・ストリーム名によってデータ・ソースを参照できます。

オプション

オプション

タイプ

目的

デフォルト値

No Data Reference Data

参照データ(「No Data Handling」カテゴリ)

後述の注意を参照

なし

非データ処理に関する注意

リーダーには、参照データ・マップを使用して各種の非データ値を正規化するオプションが用意されています。これにより、リーダーに基づくプロセスでは、非データ値が共通の方法で処理されます。デフォルトではこのオプションを使用しないため、データを元の形式でプロファイリングして把握でき、プロファイリングするときに各種の非データを識別できます。

システム・レベルの「No Data Handling」マップが用意されています。これを使用すると、空の文字列、または非データ文字(スペース、その他の印刷不可能な文字、または制御文字)のみで構成された文字列をNull値に正規化できます。

これはデータのスナップショットの作成時に使用できる機能と同じですが、この機能をリーダーで使用できるため、同じスナップショットに基づく複数のプロセスで各種の非データ(空の文字列、制御文字のみで構成された文字列など)を必要に応じた様々な方法で処理できます。

非データ文字を変更する場合は、別の非データ処理マップを使用できます。

実行

プロセスの機能に関係なく、リーダーはプロセスに不可欠な部分です。プロセッサによっては、特定タイプの実行に適さない場合があります。たとえば、リアルタイム応答プロセスでは、多数のソースからデータを照合して統合することは不可能です。これに対して、リアルタイム・リーダー・ソース(前述)を選択すると、プロセスの実行はリーダーおよびライターの構成方法によって決まるため、構成で使用できるプロセッサに制限はありません。ただし、EDQは、次の3つの実行モードに対応するように設計されています。

ライブラリには、そのプロセッサで使用可能な実行モードとともに各プロセッサがリストされています。

結果ブラウザの表示

リーダーの結果ブラウザには、基礎となるデータ・ストアに存在するすべてのレコードが表示されます。

注意: ステージング・データに対してフィルタまたはサンプリングが構成されていても、リーダーの結果には反映されません。特に、結果ブラウザには、フィルタ処理またはサンプリングされたサブセットではなく、データ・ストア内の行の合計数がレポートされます。フィルタやサンプリングは、リーダーから後続プロセッサに出力されるレコードに影響しますが、結果ブラウザには表示されません。

出力フィルタ

リーダーに出力フィルタはありません。指定のソースからすべてのレコードが読み取られ、プロセスの残りの部分で使用可能になります。

次の例では、サンプルのサービス管理プロジェクトのサービス管理データから読み取られるレコードを示します。

この場合、リーダーは、ソースからすべてのデータ属性を読み取るように構成されており、属性の順序は変更せず、デフォルトの「No Data Handling」マップも使用しません。後続の処理も定義されていません。

Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.