DP CLIのフラグ

DP CLIには、その動作を制御するために多数のランタイム・フラグが用意されています。

フラグをリストするには、引数を使用しないでCLIを実行するか、--helpフラグを使用してCLIを実行します。フラグには、2つのダッシュから始まるフルネーム(--maxRecordsなど)と、1つのダッシュを使用する省略バージョン(-mなど)があります。

CLIのフラグは、次のとおりです。
CLIのフラグ 意味
-a, --all すべてのHiveデータベース内のすべてのHive表でデータ処理を実行します。
-bl, --blackList <bl-file> Hive表をフィルタ処理で除外するために使用するブラックリストのファイル名を指定します。このリスト上の表はデータ処理によって無視されるため、プロビジョニングされません。
-d, --database <db-name> 指定したHiveデータベースを使用してデータ処理を実行します。Hive表を指定しない場合、Hiveデータベース内のすべてのHive表に対して実行されます。
-e, --runEnrichment データ・エンリッチメント・モジュール(サンプリング・フェーズ中に自動的に実行されないモジュールは除く)を実行します。
-h, --help 使用情報を表示します。
-kryo, --kryoModeFlag シリアライズを最適化するためにkryoModeをアクティブ化します。これは、特定のデータ・セットに対してテストする必要があります。
-m, --maxRecords <num> 処理するレコードの最大数を設定します。スクリプト構成設定をオーバーライドします。
-mwt, --maxWaitTime <secs> 各表処理が完了するまでの最大待機時間(秒単位)を指定します。次の表は、この時間が経過した後、またはデータの収集が完了すると同時に処理されます。このフラグの主な目的は、表の処理ペースを制御し、Hadoop/Spark/Dgraphクラスタが多数のリクエストで溢れかえらないようにすることにあります。
-nr,

--nonRandomizedCollectionNameFlag

データ・セット名をランダム化しません。このフラグは、特定のテスト用です。
-p, --collectionPrefix <prefix> データ・セットの名前の接頭辞を指定します。スクリプト構成設定をオーバーライドします。
-perf, --perfDataCollection 内部使用のみに対応しています。
-t, --table <name> 指定したHive表に対してデータ処理を実行します。Hive表を指定しない場合、デフォルトのデータベースがスクリプト構成に設定されていると想定します。表が存在しない、空である、または表プロパティskipAutoProvisioningが設定されている場合、この表はスキップされます。
-v, --versionNumber データ処理コンポーネントの現在の反復のバージョン番号を出力します。
-wl, --whiteList <wl_file> 処理対象として適格なHive表を選択するために使用するホワイトリストのファイル名を指定します。このリスト上の各表は、データ処理コンポーネントによって処理され、データ・セットとしてDgraphに収集されます。