このトピックでは、データ処理のロギング・ファイルの概要について説明します。
各ノード上のロギングの場所は、data_processing-CLIファイルのedpJarDirプロパティによって定義されます。デフォルトでは、これは/opt/bdd/edp/dataディレクトリです。
データ処理のログ・ファイルはedpLog*.logと呼ばれます。ネーミング・パターンは実際にはlogging.properties構成に設定されています。デフォルトのパターンはedpLog%u%g.logです。この場合、%uは、同時Javaプロセス間の競合を解決するための一意の番号であり、%gは、ローテーションするログを区別するための生成番号です。生成番号はローテーションするため、最後に実行されたデータ処理の生成番号が0になります。デフォルトの構成では、10,000個のログ・ファイルが作成され、その最大ファイル・サイズは1MBです。1MBを超えるログは次のログ・ファイルに繰り越されます。
[2015/01/15 14:14:15] INFO: Starting Data Processing on Hive Table: default.claims [2015/01/15 14:14:15] SEVERE: Error runnning EDP java.lang.Exception Example Error Log Message at com.oracle.endeca.pdi.EdpMain.main(EdpMain.java:38) ...
クライアントによってデータ処理ワークフローが起動されると、実際のデータ処理ジョブを実行するためにOozieジョブが作成されます。このジョブは、クラスタ内の任意のノードによって実行されます(ノードはYARNによって選択されます)。データ処理ログを検索するには、OozieジョブIDを使用してこの特定のクラスタ・ノードを突き止める必要があります。OozieジョブIDは、DP CLIの実行時にコンソールに出力されるか、Studioログ内にあります。