DP CLIフラグ

DP CLIには、その動作を制御する多数の実行時フラグがあります。

--helpフラグを使用すると、これらのフラグをリストできます。各フラグには、完全な名前を1つのダッシュ(--maxRecordsなど)から始め、省略形のバージョンを1つのダッシュ(-mなど)で始めます。

--devHelpフラグには、Oracle内部開発者およびサポート担当者が使用する予定のフラグが表示されます。したがって、これらのフラグは、このガイドではドキュメント化されていません。

注意:

すべてのフラグ名は大/小文字が区別されます。

CLIのフラグは次のとおりです:

CLIフラグ	説明
`-a`, `--all`	すべてのHiveデータベースですべてのHive表のデータ処理を実行します。
`-bl`, `--blackList <blFile>`	Hive表のフィルタ処理に使用する、ブラックリストのファイル名を指定します。このリスト内の表は無視され、プロビジョニングされません。 `--database`フラグとともに使用する必要があります。
`-clean`, `--cleanAbortedJobs`	不完全なワークフローから残ったアーティファクトをクリーンアップします。
`-d`, `--database <dbName>`	指定したHiveデータベースを使用してデータ処理を実行します。 Hive表を指定しない場合は、Hiveデータベース内のすべてのHive表に対して実行されます(`skipAutoProvisioning`プロパティが`true`に設定された表はプロビジョニングされません)。リフレッシュおよび増分更新の場合は、データ・セット・メタデータ内のデフォルト・データベースを上書きするために使用できます。
`-devHelp`, `--devHelp`	Oracleサポート担当者によって使用されるフラグの使用状況情報が表示されます。
`-disableSearch`, `--disableSearch`	検索用のDgraph索引付けを無効にします。これは、DP検出により、値の平均文字列長に関係なく、すべての属性のレコード検索および値検索が無効になることを意味します。このフラグは、プロビジョニング・ワークフロー(Hive表から作成された新しいデータ・セット)、およびリフレッシュ・ワークフロー(`--refreshData`フラグ付き)にのみ使用できます。このフラグは`--incrementalUpdate`フラグと同時に使用することはできません。
`-e`, `--runEnrichment`	データ・エンリッチメント・モジュール(サンプリング・フェーズで自動的に実行されないモジュールを除く)を実行します。 `edp.properties`構成ファイルの`runEnrichment`プロパティをオーバーライドします。 CLI `--excludePlugins`フラグを持つ一部のモジュールを除外することもできます。
`-ep`, `--excludePlugins <exList>`	データ・エンリッチメントの実行時に除外するデータ・エンリッチメント・モジュールのリストを指定します。
`-h`、`--help`	顧客用のフラグの使用情報を表示します。
`-incremental`, `--incrementalUpdate <logicalName> <filter>`	フィルタ述語を使用して新しいレコードを選択し、元のHive表のBDDデータ・セットに対して増分更新を実行します。必要に応じて、`--table`フラグと`--database`フラグを使用することもできます。
`-m`, `--maxRecords <num>`	データ・セットのサンプル・サイズ(つまり、ソースHive表からのサンプリングされたレコードの数)の最大レコード数を指定します。実際には、これによりBDDデータセット内のレコードの最大数が設定されます。この設定では、すべての新しいデータ・セットのサンプル・サイズが制御され、変換操作によって生成されるサンプル・サイズも制御されることに注意してください(変換スクリプトを含むデータ・セットのリフレッシュ更新時など)。 `edp.properties`構成ファイルのCLI `maxRecordsForNewDataSet`プロパティをオーバーライドします。
`-mwt`, `--maxWaitTime <secs>`	各表処理が完了するまでの最大待機時間を秒単位で指定します。次の表は、この間隔の経過後、またはデータ収集の完了直後に処理されます。このフラグは、表処理のスペースを制御し、HadoopおよびSparkクラスタ・ノードの他、Dgraphクラスタ・ノードが大量の同時リクエストであふれないようにします。
`-ping`, `--pingCheck`	Pingでは、データ処理に必要なコンポーネントのステータスをチェックします。
`-refresh`, `--refreshData <logicalName>`	元のHive表のBDDデータ・セットについて、データの完全リフレッシュを実行します。必要に応じて、`--table`フラグと`--database`フラグを使用することもできます。
`-t`, `--table <tableName>`	指定したHive表でデータ処理を実行します。 Hiveデータベースを指定しない場合、デフォルトのデータベースを使用する必要があります。この場合、表はスキップされます: 存在しない、空である、または表プロパティ`skipAutoProvisioning`が`true`に設定されています。リフレッシュおよび増分更新の場合は、データ・セット・メタデータ内のデフォルトのソース表を上書きするために使用できます。
`-v`, `--versionNumber`	Big Data Discovery内のデータ処理コンポーネントの現行の反復バージョン番号を印刷します。
`-wl`, `--whiteList <wlFile>`	処理対象の修飾Hive表の選択に使用されるホワイトリストのファイル名を指定します。このリストの各表はデータ処理コンポーネントによって処理され、DgraphにBDDデータ・セットとして収集されます。 `--database`フラグとともに使用する必要があります。
`UpgradeDatesetInventory <fromVersion>`	DataSet Inventoryを指定されたBDDバージョンから最新バージョンにアップグレードします。このサブコマンドは、アップグレード・スクリプトによって呼び出され、対話形式で実行しないでください。
`UpgradeSampleFiles <fromVersion>`	指定のBDDバージョンから最新バージョンにサンプル・ファイル(前のワークフローの結果として生成される)をアップグレードします。このサブコマンドは、アップグレード・スクリプトによって呼び出され、対話形式で実行しないでください。