プライマリ・コンテンツに移動
Oracle® Big Data Discovery Cloud Serviceデータ処理ガイド

E65369-05
目次へ
目次
索引へ移動
索引

前
次
機械翻訳について

リフレッシュ更新の実行

このトピックでは、更新のリフレッシュ操作を実行する方法について説明します。

この手順では:
  • StudioまたはDP CLIからデータ・セットが作成されました。
  • データ・セットはStudioプロジェクトに追加されました。

データ・セットに対してリフレッシュ更新を実行するには:

  1. リフレッシュするデータ・セットのデータ・セット論理名を取得します:
    1. Studioで「プロジェクト設定」 > 「データ・セット・マネージャ」に移動します。
    2. 「データ・セット・マネージャ」で、データ・セットを選択して、その名前の横にあるオプションを展開します。
    3. 「データ・セット論理名」フィールドから値を取得します。
  2. Linuxコマンド・プロンプトから$BDD_HOME/dataprocessing/edp_cliディレクトリに変更します。
  3. では、--refreshDataフラグおよびデータ・セット論理名を使用してDP CLIを実行します。 次に例を示します。:
    ./data_processing_CLI --refreshData 10128:WarrantyClaims
操作が成功した場合、DP CLIはこれらのメッセージをstdout出力の末尾に出力します:
[2016-06-24T09:56:22.963-04:00] [DataProcessing] [INFO] [] [org.apache.spark.Logging$class] [tid:main] [userID:fcalvill] 
         client token: N/A
         diagnostics: N/A
         ApplicationMaster host: 10.152.105.219
         ApplicationMaster RPC port: 0
         queue: root.fcalvill
         start time: 1466776490743
         final status: SUCCEEDED
         tracking URL: http://bus2014.example.com:8088/proxy/application_1466716670116_0002/A
         user: fcalvill
Refreshing existing collection: MdexCollectionIdentifier{
   databaseName=edp_cli_edp_ad9a93eb-fbec-49ca-bdc9-8ac897dd5c8f, 
   collectionName=edp_cli_edp_ad9a93eb-fbec-49ca-bdc9-8ac897dd5c8f}
Collection key for new record:  MdexCollectionIdentifier{
   databaseName=refreshed_edp_a284bd0c-23fe-4d26-9e92-cbfc22b1555e, 
   collectionName=refreshed_edp_a284bd0c-23fe-4d26-9e92-cbfc22b1555e}
data_processing_CLI finished with state SUCCESS
「YARNアプリケーションの概要」ページでは、"FINISHED"の「状態」と、"SUCCESSFUL"のFinalStatusが必要です。 「名前」フィールドには、次の例のようなエントリがあります:
EDP: DatasetRefreshConfig{hiveDatabase=, hiveTable=, 
collectionToRefresh=MdexCollectionIdentifier{databaseName=edp_cli_edp_ad9a93eb-fbec-49ca-bdc9-8ac897dd5c8f, 
collectionName=edp_cli_edp_ad9a93eb-fbec-49ca-bdc9-8ac897dd5c8f}, 
newCollectionId=MdexCollectionIdentifier{databaseName=refreshed_edp_a284bd0c-23fe-4d26-9e92-cbfc22b1555e, 
collectionName=refreshed_edp_a284bd0c-23fe-4d26-9e92-cbfc22b1555e}, 
op=REFRESH_DATASET}
「名前」に関する次の点に注意してください:
  • --databaseフラグと--tableフラグが使用されていないため、hiveDatabasehiveTableは空白です。 この場合、更新のリフレッシュ操作では、データ・セットの最初の作成時に使用されたHive表およびデータベースが使用されます。
  • collectionToRefreshは、リフレッシュされたデータ・セットの名前です。 この名前は、前述のstdoutのRefreshing existing collectionフィールドと同じです。
  • newCollectionIdは、リフレッシュされたデータ・セットの内部名です。 この名前はStudio UIには表示されません(オリジナルのデータ・セット論理名は永続名であるため引き続き使用されます)。 この名前は、前述のstdoutのCollection key for new recordフィールドとも同じです。

Dgraph HDFSエージェント・ログで、Dgraph収集操作のステータスを確認することもできます。

将来、このデータ・セットのリフレッシュが、同じデータ・セット論理名を使用することに注意してください。 このデータ・セットに更新cronジョブを設定する場合も、この名前を使用します。