Dgraph HDFSエージェントは、stdout/stderr出力をログ・ファイルに書き込みます。
Dgraph HDFSエージェント--outフラグでは、Dgraph HDFSエージェントstdout/stderrログ・ファイルのファイル名とパスを指定します。 このログ・ファイルは、インポート(収集)およびエクスポート操作の両方で使用されます。
出力ログ・ファイルの名前とロケーションは、bdd.conf
構成ファイルのAGENT_OUT_FILE
パラメータを使用して、インストール時に設定されます。 通常、ログ名はdgraphHDFSAgent.out
で、ロケーションは$BDD_HOME/logs
ディレクトリです。
Dgraph HDFSエージェント・ログは、データ処理ワークフローの最後にレコードのロードに関する問題が発生したかどうかを確認する場合に、特に重要です。 Dgraphから受信したエラー(拒否レコードなど)は、ここに記録されます。
収集操作メッセージ
New import request received: MdexCollectionIdentifier{ databaseName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c, collectionName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c}, ... requestOrigin: FROM_DATASET Received request for database edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c Starting ingest for: MdexCollectionIdentifier{ databaseName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c, collectionName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c}, ... requestOrigin: FROM_DATASET Finished reading 9983 records for MdexCollectionIdentifier{ databaseName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c, collectionName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c}, ... requestOrigin: FROM_DATASET createBulkIngester edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c sendRecordsToIngester 9983 closeBulkIngester Ingest finished with 9983 records committed and 0 records rejected. Status: INGEST_FINISHED. Request info: MdexCollectionIdentifier{ databaseName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c, collectionName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c}, location: /user/bdd/edp/data/.dataIngestSwamp/..., user name: fcalvill, notification: {"workflowName":"CLIDataLoad", "sourceDatabaseName":null, "sourceDatasetKey":null, "targetDatabaseName": "edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c", "targetDatasetKey":"edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c", "ecid":"0000LMSUWCm7ADkpSw4Eyc1NSxM1000000", "status":"IN_PROGRESS", "startTime":1467209085630, "timestamp":1467209136298, "progressPercentage":0.0, "errorMessage":null, "trackingUrl":null, "properties":{"dataSetDisplayName":"WarrantyClaims", "isCli":"true"}}, actualEcid: 0000LMSUWCm7ADkpSw4Eyc1NSxM1000000, requestOrigin: FROM_DATASET Notification server url: http://busgg2014.us.oracle.com:7003/bdd/v1/api/workflows About to send notification Terminating Notification{workflowName=CLIDataLoad, sourceDatabaseName=null, sourceDatasetKey=null, targetDatabaseName=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c, targetDatasetKey=edp_cli_edp_4dd5ac28-2e85-4efc-a3c2-391b6a78f69c, ecid=0000LMSUWCm7ADkpSw4Eyc1NSxM1000000, status=SUCCEEDED, startTime=1467209085630, timestamp=1467209222088, progressPercentage=100.0, errorMessage=null, properties={dataSetDisplayName=WarrantyClaims, isCli=true}} Notification sent successfully Terminating ...
/user/bdd/edp/data/.dataIngestSwamp
ディレクトリにAvroファイルのセットが書き込まれています。
createBulkIngester
操作は、データ・セットのバルク・ロード収集インスタンスをインスタンス化するために使用します。
sendRecordsToIngester
の操作により、Dgraph収集者に9983レコードが送信されます。
closeBulkIngester
操作でクローズされています。
Status: INGEST_FINISHED
メッセージは、収集操作の終了を示します。 また、メッセージには、正常にコミットされたレコードの数および拒否されたレコードの数も表示されます。 さらに、Dgraph HDFSエージェントが、収集が終了したことをStudioに通知します。その時点で、StudioはDataSet Inventoryのstatus
属性を収集操作の最終ステータスで更新します。 エラーが発生した場合、ステータスは、収集が成功した場合はFINISHED
またはERROR
になります。
SUCCEEDED
のステータスでワークフローが終了したことを示す最終通知をStudioに送信します。
ワークフロー全体を通して、Dgraph HDFSエージェントは常にStudioに通知更新を送信するため、Studioではワークフローの進行状況をエンド・ユーザーにレポートできます。
拒否レコード
Received error message from server: Record rejected: Character <c> is not legal in XML 1.0
ソース・レコードが大きすぎる場合は、拒否することもできます。 ソース・レコードの最大サイズには、128MBまでの制限があります。 128MBを超えるソース・レコードを収集しようとして失敗し、(拒否されたレコードの主キーを持つ)エラーが返されますが、バルク・ロード収集プロセスは、その拒否されたレコードの後も続行されます。
新しい属性および削除された属性のロギング
Finished reading 499 records for Collection name: default_edp_2a0122f2-4d15-46bf-9669-21333442f10b Adding attributes to collection: default_edp_2a0122f2-4d15-46bf-9669-21333442f10b [NumInStock] Added attributes to collection: default_edp_2a0122f2-4d15-46bf-9669-21333442f10b ... Deleting attributes from collection: default_edp_2a0122f2-4d15-46bf-9669-21333442f10b [OldPrice2] Deleted attributes from collection: default_edp_2a0122f2-4d15-46bf-9669-21333442f10b
この例では、NumInStock属性がデータ・セットに追加され、OldPrice2属性が削除されました。