このトピックでは、増分更新操作を実行する方法について説明します。
手順の例では、--tableフラグと--databaseフラグを使用していないことに注意してください。つまり、このコマンドは、データ・セットの作成元のHive表に対して実行されることになります。
データ・セットに対して増分更新を実行するには:
...
client token: N/A
diagnostics: N/A
ApplicationMaster host: web2014.example.com
ApplicationMaster RPC port: 0
queue: root.fcalvill
start time: 1437415956086
final status: SUCCEEDED
tracking URL: http://web2014.example.com:8088/proxy/application_1436970078353_0041/A
user: fcalvill
data_processing_CLI finished with state SUCCESS
EDP: IncrementalUpdateConfig{collectionId=MdexCollectionIdentifier{
databaseName=default_edp_2c08eb40-8eff-4c7e-b05e-2e451434936d,
collectionName=default_edp_2c08eb40-8eff-4c7e-b05e-2e451434936d},
whereClause=claim_date >= unix_timestamp('2006-01-01 00:00:00', 'yyy-MM-dd HH:mm:ss')}
IncrementalUpdateConfigは増分ワークフロー・タイプの名前です。
whereClauseは、コマンドで使用されるフィルタの述語をリストします。
Dgraph HDFSエージェント・ログで、Dgraph収集操作のステータスを確認することもできます。
増分更新で、フィルタの述語基準に一致するレコードがないと判断された場合、DP CLIは正常に終了し、レコードは更新されません。
このデータ・セットに対するその後の増分更新でも、引き続き同じデータ・セット論理名が使用されることに注意してください。 このデータ・セットに増分更新cronジョブを設定する場合も、この名前を使用します。