大量のXMLデータをチャンク化するにはどうすればよいですか。

HCM抽出診断を使用すれば、大量のXMLデータを複数の小さいチャンクに分割して、大量データの処理にかかる時間と使用メモリーを削減できます。

大量データのレポートの実行中にビジネスクリティカルなプロセスを使用できない問題が発生した場合は、Business Intelligence Publisher (BIP)のXMLデータのチャンク化機能を使用してください。

XMLデータのチャンク化プロセスには、次の段階があります:

  1. 抽出データのチャンク化プロセスのスケジュール
  2. 事前定義済データ・モデルに基づくBIPレポートの作成と出力の生成
  3. 出力を提供するBIPジョブのリモートからのスケジュール
  4. (オプション)抽出SFTP提供オプションを自動化して、データ・チャンクを提供します。

抽出データのチャンク化プロセスのスケジュール

  1. 「ナビゲータ」 > 「ツール」 > 「スケジュール済プロセス」をクリックします。
  2. スケジュール済プロセスの概要ページで、「新規プロセスのスケジュール」をクリックします。
  3. タイプを「ジョブ」のままにし、「抽出プロセス診断レポート」プロセスを検索して選択し、「OK」をクリックします。
  4. 「プロセス詳細」ダイアログ・ボックスの基本オプション・セクション:
    • チャンク化プロセスのスコープとして「データのチャンク化」を選択します。
    • データのチャンク元のスコープ値としてインスタンス名を選択します。
    • 必要なチャンク・サイズの数(1つのチャンク内のオブジェクト数)を示す数値を入力します。
  5. スケジュール済プロセスの場合と同じように、プロセス・セットのスケジュール、出力および通知を定義します。
  6. その他の必要なオプションを設定し、「送信」をクリックします。
  7. レポートをダウンロードし、生成されたチャンクの数を記録して確認します。一般に、生成されるチャンクの数は、チャンク・サイズおよびオブジェクト総数に基づきます。(生成されるチャンクの総数 = オブジェクト総数/チャンク・サイズ)
    次の問合せを使用して、生成されたチャンクの総数を確認します:
    select count(*) from hry_ext_parse_dtls where transformation_id = (select max(transformation_id) from hry_ext_transformation where processing_type = 'CHUNKING' and instance_name = :flow_instance_name)
    データのチャンク化に使用されるデータ表は、次のとおりです:
    • hry_ext_transformation
    • Hry_ext_parse_dtls

BIPを使用したデータ出力の生成および提供

  1. 「ナビゲータ」>「ツール」>「レポートおよび分析」をクリックします
  2. 「レポートおよび分析」ページで、「カタログの参照」をクリックします。
  3. BIPホーム・ページで、抽出定義に関連付けられたレポートをコピーし、globalReportsDataModelを、共有ディレクトリ(Shared Folders/Human Capital Management/Extracts/Data Models/)にあるDataChunkingDmデータ・モデルに変更します。
  4. レポートの名前と摘要を入力し、「Custom」ディレクトリに保存します。(Shared Folders/Custom/...)
  5. 「OK」をクリックしてレポート・ペインをオープンします。
  6. 「レポートの表示」をクリックします。
  7. 「処理」 > 「スケジュール」をクリックして、レポート・ジョブをスケジュールします。
  8. 「一般」タブで、「フロー・インスタンス名」および「チャンク番号」パラメータの値を入力します。
  9. 生成されたチャンクごとに、チャンク1からレポートを実行します。

    たとえば、処理するオブジェクトが100,000個あり、25000個のオブジェクトのチャンク・サイズを使用している場合、4個のチャンクが生成されます。すべてのオブジェクトのレポートを生成するには、チャンク1から4のレポートを実行して、4つすべてのチャンクを処理する必要があります。

  10. 「出力」タブで、宛先タイプとして「FTP」を選択し、「宛先の追加」をクリックします。
  11. サーバー・リストからFTPサーバーを選択します。
  12. データ・チャンクを提供するリモート・ディレクトリ・フォルダ・パスを入力します。
  13. 生成されたファイルのファイル名を入力します。
  14. 「送信」をクリックして、レポート・ジョブをスケジュールします。

(オプション)データ・チャンクを提供する提供オプションの自動化

  1. 抽出定義を開き、「提供」タブをクリックします。
  2. 提供タイプが「FTP」の新しい提供オプションを追加します。
  3. 提供オプションでは同じレポート名とテンプレート名が維持されます。リモート・ディレクトリ・パスおよびSFTPサーバー名を入力します。
  4. 新しく追加された提供オプションに対して作成された「抽出提供モード」の追加詳細を削除します。
  5. 抽出定義を確認して保存します。
  6. 前述のステップに従ってデータのチャンク化プロセスを実行し、SFTPサーバーへの自動提供をトリガーする提供オプション名を指定します。