選択したビューをHDFSまたは別のマシンにエクスポートできます。エクスポートには複数値属性を処理するためのオプションが含まれます。
エクスポートを構成および完了するには、次の手順を実行します。
「プレビュー」に、選択したビューの最初の3件のレコードが表示されます。
デフォルトのファイル名は、選択したビューの名前の後に現在の日付(mmddyyyy)が付きます。
たとえば、salesという名前のビューを2015年2月1日にエクスポートする場合、デフォルトのファイル名はsales02012015です。
| オプション | 説明 |
|---|---|
| HDFS | データをHDFSにエクスポートします。
エクスポートするデータのディレクトリ・パスは、必ずユーザー・ディレクトリから始まります。「ファイル・パス」フィールドに、ユーザー・ディレクトリから、ファイルを配置するサブディレクトリへのパスを入力します。 データからHive表も作成するには、「Hive表の作成」チェック・ボックスを選択します。表の名前と説明を指定するように求められます。 デフォルトでは、表名はファイル名と同じになります。 |
| マイ・コンピュータ | データを使用して、外部ディレクトリにファイルを作成します。 |
複数値属性の値を置換する予定がある場合は、Avroファイルにはエクスポートできません。
Avroファイルにエクスポートするとき、属性の表示名にAvroの列名として無効な文字が含まれていると、かわりに属性キーが使用されます。
値をそのままにしておく場合は、「変換なし」をクリックします。
値を変換するには、「一意の値の置換」をクリックします。
値の置換では、複数値属性それぞれが、属性値を表す一連のブール属性によって置換されます。これらの属性それぞれについて、レコードに値が含まれる場合は属性値がTrue、値が含まれない場合はFalseになります。
たとえば、すべてのレコードにおいて、Colorの一意の値がRed、GreenおよびBlueであるとします。エクスポートしたデータでは、Color属性はRed属性、Green属性およびBlue属性によって置換されます。

たとえば、複数値のColor属性の場合、データに次の値が含まれるとします。
| 値 | 値を含むレコード数 |
|---|---|
| Red | 50 |
| Blue | 200 |
| Green | 35 |
| Purple | 20 |
| Black | 100 |
列の最大数を3に設定すると、エクスポート時にはBlue、BlackおよびRedのみに対して新しい属性が作成されます。これらは、データに最も多く含まれる3色です。
Data Exploration and Analysis Guide · Version 1.0.0 · January 2015
Copyright © 2015 Oracle and/or its affiliates. All rights reserved.
