DP CLIのフラグ

DP CLIには、その動作を制御するために多数のランタイム・フラグが用意されています。

--helpフラグを使用する場合は、これらのフラグをリストできます。フラグには、2つのダッシュから始まるフルネーム(--maxRecordsなど)と、1つのダッシュを使用する省略バージョン(-mなど)があります。

--devHelpフラグでは、Oracle内部開発者およびサポート担当者が使用することを目的としたフラグが表示されます。このため、このガイドではこれらのフラグについて説明しません。

注意: すべてのフラグ名では大文字と小文字が区別されます。
CLIのフラグは、次のとおりです。
CLIフラグ 説明
-a--all すべてのHiveデータベース内のすべてのHive表でデータ処理を実行します。
-bl--blackList <blFile> Hive表をフィルタ処理で除外するために使用するブラックリストのファイル名を指定します。このリスト上の表はデータ処理によって無視され、プロビジョニングされません。--databaseフラグとともに使用する必要があります。
-clean--cleanAbortedJobs 不完全なワークフローから残されたアーティファクトをクリーンアップします。
-d--database <dbName> 指定したHiveデータベースを使用してデータ処理を実行します。Hive表が指定されていない場合、Hiveデータベース内のすべてのHive表に対して実行します(skipAutoProvisioningプロパティがtrueに設定されている表はプロビジョニングされないことに注意してください)。

リフレッシュ更新と増分更新では、データ・セットのメタデータ内のデフォルト・データベースをオーバーライドするために使用できます。

-devHelp--devHelp Oracleサポート担当者が使用することを目的としたフラグの使用方法情報を表示します。
-e, --runEnrichment データ・エンリッチメント・モジュール(サンプリング・フェーズ中に自動的に実行されないモジュールは除く)を実行します。edp.properties構成ファイルのCLI --runEnrichmentプロパティをオーバーライドします。

CLI --excludePluginsフラグで一部のモジュールを除外することもできます。

-ep--excludePlugins <exList> データ・エンリッチメントが実行される際に除外するデータ・エンリッチメント・モジュールのリストを指定します。
-h, --help 顧客が使用することを目的としたフラグの使用方法情報を表示します。
-incremental--incrementalUpdate <dsKey> <filter> 新規レコードを選択するフィルタ述語を使用して、元のHive表からBDDデータ・セットの増分更新を実行します。オプションで、--tableおよび--databaseフラグを使用できます。
-m, --maxRecords <num> 新規データ・セットに対して処理するレコードの最大数を設定します。edp.properties構成ファイルのCLI maxRecordsForNewDataSetプロパティをオーバーライドします。
-mwt, --maxWaitTime <secs> 各表処理が完了するまでの最大待機時間(秒単位)を指定します。次の表は、この時間が経過した後、またはデータの収集が完了すると同時に処理されます。

このフラグは、表の処理のペースを制御し、HadoopおよびSparkクラスタ・ノードとDgraphクラスタ・ノードが大量の同時リクエストで溢れないようにします。

-ping--pingCheck データ処理に必要なコンポーネントのステータスのpingチェックを行います。
-refresh--refreshData <dsKey> 元のHive表からBDDデータ・セットのフル・データ・リフレッシュを実行します。オプションで、--tableおよび--databaseフラグを使用できます。
-t--table <tableName> 指定したHive表に対してデータ処理を実行します。Hiveデータベースが指定されていない場合、デフォルトのデータベースを想定します。表が存在しない、空である、または表プロパティskipAutoProvisioningtrueに設定されている場合、この表はスキップされます。

リフレッシュ更新と増分更新では、データ・セットのメタデータ内のデフォルト・ソース表をオーバーライドするために使用できます。

--UpgradeDatesetInventory <toVersion> DataSetインベントリを最新バージョンにアップグレードします。このオプションは、BDDインストールを最新バージョンにアップグレードする場合にのみ使用します。
--UpgradeSampleFiles <toVersion> サンプル・ファイル(前のワークフローの結果として生成)を最新バージョンにアップグレードします。このオプションは、BDDインストールを最新バージョンにアップグレードする場合にのみ使用します。
-v, --versionNumber Big Data Discovery内のデータ処理コンポーネントの現在の反復のバージョン番号を出力します。
-wl--whiteList <wlFile> 処理対象として適格なHive表を選択するために使用するホワイトリストのファイル名を指定します。このリスト上の各表は、データ処理コンポーネントによって処理され、BDDデータ・セットとしてDgraphに収集されます。--databaseフラグとともに使用する必要があります。