プロジェクト・ビューまたは「結果表」からデータをHDFSまたはコンピュータにエクスポートできます。
- プロジェクト・ビューからエクスポートする場合は、コントロール・パネル・アイコンをクリックしてデータ・セットのエクスポートを選択します:
「結果表」からエクスポートする場合は、「処理→エクスポート」を選択します。
「データのエクスポート」ダイアログが開きます。
- プロジェクト・ビューからエクスポートする場合は、「データ選択」ドロップダウン・リストから、エクスポートするデータ・セットを選択します。
「プレビュー」に、選択したデータ・セットの最初の3レコードが表示されます。
- 「ファイル名」フィールドに、データのエクスポート先のファイル名を入力します。
デフォルトでは、これは選択されているデータ・セットの名前で、その後に現在の日付が続きます(たとえば、Vehicle_Warranty_Claims_03022015
)。
- エクスポート先リストから、ファイルをエクスポートするロケーションを選択します:
- HDFSにエクスポートする場合、次の手順を実行します:
- 「ファイル・パス」フィールドに、エクスポート先のHDFSディレクトリへのパスを入力します。
デフォルトでは、このパスは/user/bdd/exports
で始まります。
- エクスポートされたデータに基づいて新しいHive表を作成する場合は、「Hive表の作成」チェック・ボックスを選択し、「表名」フィールドに表の名前を入力します。
デフォルトでは、これは、Vehicle_Wattanty_Claims_030215
など、現在の日付が続くデータ・セットの名前です。
オプションで、「説明の追加」フィールドに表の説明を入力します。
- タイプリストから、エクスポート先のファイルのタイプを選択します:
Avroを選択すると、データの複数値属性のいずれも同時に使用できなくなります。
- 区切りファイルにエクスポートする場合は、フィールドおよび複数値属性のデリミタを選択します。
Other...を選択した場合、新しいデリミタも指定する必要があります。 これは1つのunicode文字で、値は127以下である必要があります。
- データの複数値属性を操作する場合は、次の手順を実行します:
注意:
このオプションは、Avroファイルには使用できません。
- 「複数値属性の処理」をクリックして、「一意の値の置換」を選択します。
- 転送する属性を選択します。
「すべての複数値属性に適用」チェック・ボックスを選択することで、すべての属性を選択できます。 ただし、置換される各属性に作成される新しい列の数を制限する場合は、一度に1つずつ選択する必要があります。
- 選択した各属性のポップアップで、必要に応じて「作成される列を最上位の値のみに制限」チェック・ボックスを選択し、列制限を入力します。
これによって、データが、多数の可能な値を含む属性の列に混乱するのを防ぐことができます。
- 「エクスポート」をクリックします。