実行オプション

EDQでは、GUIで対話型操作として(プロジェクト・ブラウザでオブジェクトを右クリックして「実行」を選択)、またはスケジュール済ジョブの一部として、次の種類のタスクを実行できます。

タスクには様々な実行オプションが含まれます。詳細は、次のタスクをクリックしてください。

また、ジョブを設定する際に、フェーズの実行前または実行後に実行するようにトリガーを設定することもできます。

ジョブを設定するときに、タスクをいくつかのフェーズに分割できます。これによって、処理順序を制御したり、含まれるタスクの成功または失敗によってジョブの実行方法を変えたい場合に条件付きの実行を使用したりすることができます。

スナップショット

ジョブの一部として「スナップショット」を実行するように構成する際には、1つのオプション「有効」があり、デフォルトで設定されています。

このオプションを無効化すると、ジョブ定義は保持されますが、スナップショットのリフレッシュが一時的に無効になります。たとえば、スナップショットをすでに実行したため、ジョブのタスクのみを後で再実行しようとしている場合に該当します。

プロセス

ジョブの一部として、またはクイック実行オプションとプロセス実行プリファレンスを使用して、プロセスを実行する際には、様々なオプションを使用できます。

  • リーダー(処理するレコードのオプション)

  • プロセス(プロセスによる結果の書込み方法のオプション)

  • 実行モード(リアルタイム・プロセスのオプション)

  • ライター(プロセスのレコードの書込み方法のオプション)

リーダー

プロセスのリーダーごとに次のオプションを設定できます。

サンプル?

「サンプル」オプションではジョブ固有のサンプリング・オプションを指定できます。たとえば、通常は数百万件のレコードに対して実行されるプロセスがあるとします。ただし、テスト目的などで、ある特定のレコードのみを処理するように特定のジョブを設定したい場合があります。

「サンプリング」の下のオプションを使用して必要なサンプリングを指定し、「サンプル」オプションを使用して有効にします。

使用可能なサンプリング・オプションはリーダーの接続方法によって異なります。

リアルタイム・プロバイダに接続しているリーダーの場合、「カウント」オプションを使用して指定レコード数で終了するようにプロセスを制限できます。または「期間」オプションを使用して期間を制限してプロセスを実行できます。たとえば、リアルタイム・モニタリング・プロセスを1時間のみ実行できます。

ステージング済データ構成に接続しているリーダーの場合、スナップショットの構成に使用できるのと同じサンプリングとフィルタのオプションを使用して、定義済レコード・セットのサンプルのみに対して実行するようにプロセスを制限できます。たとえば、データ・ソースの最初の1000レコードのみを処理するプロセスを実行できます。

「サンプリング・オプション」のフィールドを次に示します。

  • すべて - すべてのレコードをサンプリングします。

  • カウント - nレコードをサンプリングします。選択するサンプリング順序に応じて、最初のn件のレコードまたは最後のn件のレコードになります。

  • パーセンテージ - レコードの合計数のn%をサンプリングします。

  • サンプリング・オフセット - この数よりも後のレコードに対してサンプリングを実行します。

  • サンプリング順序 - 「降順」(最初のレコードから)または「昇順」(最後から)。

注意:

たとえば、2000件のレコード・セットに対してサンプリング・オフセットに1800が指定されると、「カウント」または「パーセンテージ」フィールドに指定された値にかかわらず200レコードしかサンプリングされません。

プロセス

プロセス実行プリファレンスの一部として、またはジョブの一部として、プロセスを実行するときに次のオプションを使用できます。

表1-138 プロセス・オプション

オプション 説明

インテリジェント実行を使用?

「インテリジェント実行の使用」は、プロセスの現在の構成に基づく最新結果を得ているプロセッサは、その結果を再生成しないことを意味します。最新結果がないプロセッサは、再実行マーカーによってマークされます。インテリジェント実行はデフォルトで選択されています。プロセス内のリーダーでレコードのサンプリングまたはフィルタを選択した場合は、インテリジェント実行の設定にかかわらずすべてのプロセッサが再実行します。プロセスが異なるセットのレコードに対して実行されるためです。

照合プロセッサでのソート/フィルタを有効化?

このオプションは、プロセスの任意の照合プロセッサに指定されたソート/フィルタ有効化設定(各照合プロセッサの「拡張オプション」)が、プロセス実行の一部として実行されることを意味します。このオプションはデフォルトで選択されます。大容量のデータが一致する場合は、ソート/フィルタ有効化タスクを実行して一致結果の確認を許可すると、長い時間がかかる可能性があるため、このオプションの選択を解除して後に延ばすことをお薦めします。たとえば、一致結果を外部にエクスポートする場合、「ソート/フィルタの有効化」プロセスが実行するのを待たずに、照合プロセスが完了したらすぐにデータのエクスポートを開始できます。照合プロセスの結果を確認する必要がない場合には、設定を完全にオーバーライドすることもできます。

結果のドリルダウン

このオプションでは、「結果のドリル・ダウン」の必要なレベルを選択できます。

「すべて」では、プロセスに読み込まれるすべてのレコードにドリルダウンできます。これは少量のデータ(数千件までのレコード)を処理している場合のみ、プロセスに読み込まれたすべてのレコードの処理を確認およびチェックできるようにする際にお薦めします。

「サンプル」はデフォルト・オプションです。これはプロセスの標準的な実行にお薦めします。このオプションを選択すると、プロセスによって生成されるすべてのドリルダウンでレコードのサンプルを使用できるようになります。このオプションでは、ドリルダウンしたときに必ずレコードが表示されて結果を調べることができますが、プロセスによって書き込まれるデータ容量が多くなりすぎることはありません。

「なし」では、プロセスによってメトリックが生成されますが、データにドリルダウンすることはできません。これは、すでに設計とテストが終了したデータ・クレンジング・プロセスを実行する場合など、ソースからターゲットにできるだけ早くプロセスを実行する場合にお薦めします。

ダッシュボードに公開?

このオプションでは、結果をダッシュボードに公開するかどうかを設定します。結果を公開するためには、プロセスの1つ以上の監査プロセッサでダッシュボードの公開をあらかじめ有効にしておく必要があることに注意してください。

実行モード

必要な実行タイプをサポートするために、EDQでは3種類の実行モードが用意されています。

リアルタイム・プロバイダに接続しているリーダーがプロセスにない場合、プロセスは常に標準モード(以下を参照)で実行します。

リアルタイム・プロバイダに接続しているリーダーが少なくとも1つプロセスに含まれる場合、プロセスの実行モードを次の3つのオプションから選択できます。

標準モード

標準モードでは、プロセスはレコードのバッチを完了するまで実行します。レコードのバッチはリーダーの構成によって定義されます。さらに、その他のサンプリング・オプションがプロセス実行プリファレンスまたはジョブ・オプションで設定されることもあります。

準備モード

準備モードが必要なのは、プロセスがリアルタイム・レスポンスを提供する必要がある場合です。ただし、これが可能になるのは、プロセスのリアルタイムでない部分がすでに実行された場合、つまりプロセスの準備が完了した場合のみです。

準備モードが最も使用されるのはリアルタイム参照照合です。この場合、同じプロセスが別のジョブおよび別のモードで実行するようにスケジュールされます。最初のジョブは、プロセスのリアルタイム以外の部分(たとえば、照合用の参照データに対するすべてのクラスタ・キーの作成など)をすべて実行して、リアルタイム・レスポンス実行のためにプロセスを準備します。2番目のジョブはリアルタイム・レスポンス・プロセスとして実行します(おそらく間隔モード)。

間隔モード

間隔モードでは、プロセスが長期間(絶え間なく)実行しますが、処理の結果は間隔ごとに書き込まれます。レコードまたは時間の制限に達すると、1つの間隔が完了して新しい間隔が始まります。レコードと時間両方のしきい値が指定されている場合は、いずれかのしきい値に達すると新しい間隔が始まります。

間隔モードのプロセスは長時間実行できるため、結果を保存しておく間隔の数を構成できることが重要です。これは、間隔の数または期間によって定義できます。

たとえば、連続して実行し、毎日新しい間隔が開始するようにリアルタイム・レスポンス・プロセスのオプションを設定できます。たとえば、最大10の間隔(つまり10日分の結果)を保存できます。

連続実行するプロセスもダッシュボードに結果を公開できることに注意してください。時間とレコードの間隔に対して傾向分析をプロットできます。

間隔モードでの処理結果の参照

プロセスが間隔モードで実行しているとき、完了した間隔の結果を参照できます(間隔を保存するために指定されているオプションに対して古すぎない場合)。

結果ブラウザには単純なドロップダウン選択ボックスがあり、各間隔の開始日時と終了日時が表示されます。デフォルトでは最後に完了した間隔が表示されます。間隔を選択して結果を参照します。

プロセスを開いているときに新しい結果セットが表示可能になると、ステータス・バーに通知が示されます。その後、ドロップダウン選択ボックスで新しい結果を選択できます。

ライター

プロセスのライターごとに次のオプションを設定できます。

  • Write Data? このオプションは、ライターが実行されるかどうかを設定します。つまり、書き込んでデータをステージングするライターの場合、このオプションを選択解除するとステージング済データが書き込まれません。リアルタイム・コンシューマに書き込むライターの場合、このオプションを選択解除するとリアルタイム・レスポンスが書き込まれません。

    これは次の2つのケースで役立ちます。

    1. 書き込まれたデータをリポジトリにステージングせずに、データを直接エクスポート・ターゲットにストリームする場合。ライターは、書き込む属性を選択するためのみに使用されます。このケースでは、データの書込みオプションの選択を解除し、エクスポート・タスクをジョブ定義のこのプロセスの後に追加します。

    2. ライターを一時的に無効にする場合。たとえば、テストのためにプロセスをリアルタイム実行からバッチ実行に切り替える場合に、リアルタイム・レスポンスを発行するライターを一時的に無効化することがあります。

  • Enable Sort/Filter? このオプションでは、「ステージング済データ」ライターによって書き込まれたデータのソートとフィルタを有効化するかどうかを設定します。通常、ライターによって書き込まれたステージング済データに対してソートとフィルタを有効にする必要があるのは、ユーザーが結果のソートとフィルタを望む別のプロセスによってデータが読み取られる予定がある場合、またはライターの結果そのもののソートとフィルタを行う必要がある場合です。

    このオプションはリアルタイム・コンシューマに接続しているライターには影響しません。

外部タスク

プロジェクトに構成されているすべての外部タスク(ファイルのダウンロードまたは外部実行ファイル)は、同じプロジェクト内のジョブに追加できます。

ジョブの一部として実行するように「外部タスク」を構成する際には、1つのオプション「有効」があります。

エクスポート・オプションの有効化または無効化では、ジョブ定義を維持したままで、データのエクスポートを一時的に有効化または無効化できます。

エクスポート

ジョブの一部として実行するように「エクスポート」を構成するとき、エクスポートを有効化または無効化できます(ジョブ定義を維持したままで、データのエクスポートを一時的に有効化または無効化できます)。また、次のオプションを使用して、ターゲット・データ・ストアにデータを書き込む方法を指定できます。

現在のデータおよび挿入の削除(デフォルト)

EDQでは、ターゲットの表またはファイルの現在のデータすべてを削除し、適用範囲内データをエクスポートに挿入します。たとえば、外部データベースに書き込んでいる場合は、表を切り捨ててデータを挿入します。または、ファイルに書き込んでいる場合は、ファイルを再作成します。

現在のデータに追加

EDQでは、ターゲットの表またはファイルのデータを削除せずに、適用範囲内データをエクスポートに追加します。UTF-16ファイルに追加する場合は、バイト順序マーカーが新しいデータの先頭に書き込まれないように、UTF-16LEまたはUTF-16-BE文字セットを使用してください。

主キーを使用してレコードを置換します

EDQでは、エクスポートの適用範囲データにも存在するレコード(主キーの照合によって判別)をすべてターゲット表から削除し、適用範囲内データを挿入します。

注意:

エクスポートがディレクタでスタンドアロン・タスクとして実行される場合(「エクスポート」を右クリックして「実行」を選択する場合)、常に「現在のデータおよび挿入の削除」モードで実行します。

「現在のデータおよび挿入の削除」モードと「主キーを使用してレコードを置換します」モードでは、削除操作の後で挿入操作を行います。更新ではありません。ターゲット・データベースの参照整合性ルールによってレコードの削除が妨げられ、そのためにエクスポート・タスクが失敗する可能性があります。このようなケースでかわりに更新操作を実行するためには、専用のデータ統合製品(Oracle Data Integratorなど)の使用をお薦めします。

結果ブックのエクスポート

ジョブの一部として実行するように「結果ブックのエクスポート」を構成する際には、エクスポートを有効化または無効化する1つのオプションがあります。必要な場合には同じ構成を維持したままで一時的にエクスポートを無効にできます。

トリガー

トリガーは、処理の特定の時点でEDQが実行できるアクションが具体的に構成されたものです。

ジョブでフェーズの前に実行

ジョブでフェーズの後に実行

手動の照合決定を行うとき(たとえば、ある人物がウォッチリストと完全に一致するかなど、別のアプリケーションに影響する決定が行われたときにそのアプリケーションに通知する場合)。