Dgraph HDFSエージェントは、stdout/stderr出力をログ・ファイルに書き込みます。
Dgraph HDFSエージェント--outフラグでは、Dgraph HDFSエージェントstdout/stderrログ・ファイルのファイル名とパスを指定します。 このログ・ファイルは、インポート(収集)およびエクスポート操作の両方で使用されます。
出力ログ・ファイルの名前とロケーションは、bdd.conf構成ファイルのAGENT_OUT_FILEパラメータを使用して、インストール時に設定されます。 通常、ログ名はdgraphHDFSAgent.outで、ロケーションは$BDD_HOME/logsディレクトリです。
Dgraph HDFSエージェント・ログは、データ処理ワークフローの最後にレコードのロードに関する問題が発生したかどうかを確認する場合に、特に重要です。 Dgraphから受信したエラー(拒否レコードなど)は、ここに記録されます。
収集操作メッセージ
New import request received: MdexCollectionIdentifier{
databaseName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c,
collectionName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c},
...
requestOrigin: FROM_DATASET
Received request for database edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c
Starting ingest for: MdexCollectionIdentifier{
databaseName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c,
collectionName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c},
...
requestOrigin: FROM_DATASET
Finished reading 9983 records for MdexCollectionIdentifier{
databaseName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c,
collectionName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c},
...
requestOrigin: FROM_DATASET
createBulkIngester edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c
sendRecordsToIngester 9983
closeBulkIngester
Ingest finished with 9983 records committed and 0 records rejected.
Status: INGEST_FINISHED.
Request info: MdexCollectionIdentifier{
databaseName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c,
collectionName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c},
location: /user/bdd/edp/data/.dataIngestSwamp/...,
user name: fcalvill,
notification: {"workflowName":"CLIDataLoad",
"sourceDatabaseName":null,
"sourceDatasetKey":null,
"targetDatabaseName":
"edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c",
"targetDatasetKey":"edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c",
"ecid":"0000LMSUWCm7ADkpSw4Eyc1NSxM1000000",
"status":"IN_PROGRESS",
"startTime":1467209085630,
"timestamp":1467209136298,
"progressPercentage":0.0,
"errorMessage":null,
"trackingUrl":null,
"properties":{"dataSetDisplayName":"WarrantyClaims",
"isCli":"true"}},
actualEcid: 0000LMSUWCm7ADkpSw4Eyc1NSxM1000000,
requestOrigin: FROM_DATASET
Notification server url: http://busgg2014.us.oracle.com:7003/bdd/v1/api/workflows
About to send notification
Terminating
Notification{workflowName=CLIDataLoad,
sourceDatabaseName=null, sourceDatasetKey=null,
targetDatabaseName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c,
targetDatasetKey=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c,
ecid=0000LMSUWCm7ADkpSw4Eyc1NSxM1000000,
status=SUCCEEDED,
startTime=1467209085630,
timestamp=1467209222088,
progressPercentage=100.0,
errorMessage=null,
properties={dataSetDisplayName=WarrantyClaims, isCli=true}}
Notification sent successfully
Terminating
...
/user/bdd/edp/data/.dataIngestSwampディレクトリにAvroファイルのセットが書き込まれています。
createBulkIngester操作は、データ・セットのバルク・ロード収集インスタンスをインスタンス化するために使用します。
sendRecordsToIngesterの操作により、Dgraph収集者に9983レコードが送信されます。
closeBulkIngester操作でクローズされています。
Status: INGEST_FINISHEDメッセージは、収集操作の終了を示します。 また、メッセージには、正常にコミットされたレコードの数および拒否されたレコードの数も表示されます。 さらに、Dgraph HDFSエージェントが、収集が終了したことをStudioに通知します。その時点で、StudioはDataSet Inventoryのstatus属性を収集操作の最終ステータスで更新します。 エラーが発生した場合、ステータスは、収集が成功した場合はFINISHEDまたはERRORになります。
SUCCEEDEDのステータスでワークフローが終了したことを示す最終通知をStudioに送信します。
ワークフロー全体を通して、Dgraph HDFSエージェントは常にStudioに通知更新を送信するため、Studioではワークフローの進行状況をエンド・ユーザーにレポートできます。
拒否レコード
Received error message from server: Record rejected: Character <c> is not legal in XML 1.0
ソース・レコードが大きすぎる場合は、拒否することもできます。 ソース・レコードの最大サイズには、128MBまでの制限があります。 128MBを超えるソース・レコードを収集しようとして失敗し、(拒否されたレコードの主キーを持つ)エラーが返されますが、バルク・ロード収集プロセスは、その拒否されたレコードの後も続行されます。
新しい属性および削除された属性のロギング
Finished reading 499 records for Collection name: default_edp_2a0122f2-4d15-46bf-9669-21333442f10b Adding attributes to collection: default_edp_2a0122f2-4d15-46bf-9669-21333442f10b [NumInStock] Added attributes to collection: default_edp_2a0122f2-4d15-46bf-9669-21333442f10b ... Deleting attributes from collection: default_edp_2a0122f2-4d15-46bf-9669-21333442f10b [OldPrice2] Deleted attributes from collection: default_edp_2a0122f2-4d15-46bf-9669-21333442f10b
この例では、NumInStock属性がデータ・セットに追加され、OldPrice2属性が削除されました。