このトピックでは、更新のリフレッシュ操作を実行する方法について説明します。
データ・セットに対してリフレッシュ更新を実行するには:
[2016-06-24T09:56:22.963-04:00] [DataProcessing] [INFO] [] [org.apache.spark.Logging$class] [tid:main] [userID:fcalvill]
client token: N/A
diagnostics: N/A
ApplicationMaster host: 10.152.105.219
ApplicationMaster RPC port: 0
queue: root.fcalvill
start time: 1466776490743
final status: SUCCEEDED
tracking URL: http://bus2014.example.com:8088/proxy/application_1466716670116_0002/A
user: fcalvill
Refreshing existing collection: MdexCollectionIdentifier{
databaseName=edp_cli_edp_ad9a93eb-fbec-49ca-bdc9-8ac897dd5c8f,
collectionName=edp_cli_edp_ad9a93eb-fbec-49ca-bdc9-8ac897dd5c8f}
Collection key for new record: MdexCollectionIdentifier{
databaseName=refreshed_edp_a284bd0c-23fe-4d26-9e92-cbfc22b1555e,
collectionName=refreshed_edp_a284bd0c-23fe-4d26-9e92-cbfc22b1555e}
data_processing_CLI finished with state SUCCESS
EDP: DatasetRefreshConfig{hiveDatabase=, hiveTable=,
collectionToRefresh=MdexCollectionIdentifier{databaseName=edp_cli_edp_ad9a93eb-fbec-49ca-bdc9-8ac897dd5c8f,
collectionName=edp_cli_edp_ad9a93eb-fbec-49ca-bdc9-8ac897dd5c8f},
newCollectionId=MdexCollectionIdentifier{databaseName=refreshed_edp_a284bd0c-23fe-4d26-9e92-cbfc22b1555e,
collectionName=refreshed_edp_a284bd0c-23fe-4d26-9e92-cbfc22b1555e},
op=REFRESH_DATASET}
hiveDatabaseとhiveTableは空白です。 この場合、更新のリフレッシュ操作では、データ・セットの最初の作成時に使用されたHive表およびデータベースが使用されます。
collectionToRefreshは、リフレッシュされたデータ・セットの名前です。 この名前は、前述のstdoutのRefreshing existing collectionフィールドと同じです。
newCollectionIdは、リフレッシュされたデータ・セットの内部名です。 この名前はStudio UIには表示されません(オリジナルのデータ・セット論理名は永続名であるため引き続き使用されます)。 この名前は、前述のstdoutのCollection key for new recordフィールドとも同じです。
Dgraph HDFSエージェント・ログで、Dgraph収集操作のステータスを確認することもできます。
将来、このデータ・セットのリフレッシュが、同じデータ・セット論理名を使用することに注意してください。 このデータ・セットに更新cronジョブを設定する場合も、この名前を使用します。