プライマリ・コンテンツに移動
Oracle® Big Data Discovery Cloud Serviceデータ処理ガイド

E65369-05
目次へ
目次
索引へ移動
索引

前
次
機械翻訳について

Studioからのデータのエクスポート

Dgraph HDFSエージェントは、Studioプロジェクトからデータをエクスポートするためのコンジットです。

Studioのプロジェクト内から、データを新しいAvroファイル(.avro拡張子)、CSVファイル(.csv拡張子)またはテキスト・ファイル(.txt拡張子)としてエクスポートできます。 ファイルは、コンピュータ上の外部ディレクトリまたはHDFSにエクスポートできます。 操作の詳細は、「Studioユーザー・ガイド」を参照してください。

ユーザーがStudioからHDFSのファイルにデータ・セットをエクスポートする場合、エクスポートされるファイル所有者は常にHDFSエージェント・プロセスの所有者(またはKerberizedクラスタ内のHDFSエージェント・プリンシパルの所有者)になります。 つまり、Dgraph HDFSエージェントは、エクスポート・リクエストからユーザー名を使用して、FileSystemオブジェクトを作成します。 そのようにすると、ユーザーがファイルに権限がない場合、BDDによってファイルが作成されないことが保証され、ファイルが作成されると、そのユーザーがファイルを所有します。 グループは、Hadoopによって自動的に割り当てられます。

エクスポート操作の一環として、ユーザーはエクスポートするファイルで使用する区切り文字を指定します:
  • デリミタがカンマの場合、エクスポート・プロセスで.csvファイルが作成されます。
  • デリミタがカンマ以外の場合、エクスポート・プロセスで.txtファイルが作成されます。

HDFSにエクスポートする場合、データからHive表を作成するオプションもあります。 Hive表が作成された後、データ処理ワークフローが起動され、新しいデータ・セットが作成されます。

次の図は、StudioからHDFSにデータをエクスポートするプロセスを示しています:

この図は、Studio (Big Data Discovery内)からHDFSにデータをエクスポートするプロセスを示しています。

このダイアグラムでは、次のアクションが実行されます:
  1. Studio内の「変換」から、データをHDFSにエクスポートするよう選択できます。 これにより、データをDgraphにエクスポートする内部リクエストが送信されます。
  2. DgraphはDgraph HDFSエージェントと通信し、データのエクスポート処理を起動して、ファイルをHDFSに書き込みます。
  3. 必要に応じて、データからHive表を作成することもできます。 その場合、Hive表はHDFSに作成されます。

エクスポート中に発生する可能性のあるエラーは、Dgraph HDFSエージェント・ログに入力されます。