このトピックでは、更新のリフレッシュ操作を実行する方法について説明します。
データ・セットに対してリフレッシュ更新を実行するには:
[2016-06-24T09:56:22.963-04:00] [DataProcessing] [INFO] [] [org.apache.spark.Logging$class] [tid:main] [userID:fcalvill] client token: N/A diagnostics: N/A ApplicationMaster host: 10.152.105.219 ApplicationMaster RPC port: 0 queue: root.fcalvill start time: 1466776490743 final status: SUCCEEDED tracking URL: http://bus2014.example.com:8088/proxy/application_1466716670116_0002/A user: fcalvill Refreshing existing collection: MdexCollectionIdentifier{ databaseName=edp_cli_edp_ad9a93eb-fbec-49ca-bdc9-8ac897dd5c8f, collectionName=edp_cli_edp_ad9a93eb-fbec-49ca-bdc9-8ac897dd5c8f} Collection key for new record: MdexCollectionIdentifier{ databaseName=refreshed_edp_a284bd0c-23fe-4d26-9e92-cbfc22b1555e, collectionName=refreshed_edp_a284bd0c-23fe-4d26-9e92-cbfc22b1555e} data_processing_CLI finished with state SUCCESS
EDP: DatasetRefreshConfig{hiveDatabase=, hiveTable=, collectionToRefresh=MdexCollectionIdentifier{databaseName=edp_cli_edp_ad9a93eb-fbec-49ca-bdc9-8ac897dd5c8f, collectionName=edp_cli_edp_ad9a93eb-fbec-49ca-bdc9-8ac897dd5c8f}, newCollectionId=MdexCollectionIdentifier{databaseName=refreshed_edp_a284bd0c-23fe-4d26-9e92-cbfc22b1555e, collectionName=refreshed_edp_a284bd0c-23fe-4d26-9e92-cbfc22b1555e}, op=REFRESH_DATASET}
hiveDatabase
とhiveTable
は空白です。 この場合、更新のリフレッシュ操作では、データ・セットの最初の作成時に使用されたHive表およびデータベースが使用されます。
collectionToRefresh
は、リフレッシュされたデータ・セットの名前です。 この名前は、前述のstdoutのRefreshing existing collection
フィールドと同じです。
newCollectionId
は、リフレッシュされたデータ・セットの内部名です。 この名前はStudio UIには表示されません(オリジナルのデータ・セット論理名は永続名であるため引き続き使用されます)。 この名前は、前述のstdoutのCollection key for new record
フィールドとも同じです。
Dgraph HDFSエージェント・ログで、Dgraph収集操作のステータスを確認することもできます。
将来、このデータ・セットのリフレッシュが、同じデータ・セット論理名を使用することに注意してください。 このデータ・セットに更新cronジョブを設定する場合も、この名前を使用します。