プライマリ・コンテンツに移動
Oracle® Big Data Discovery Cloud Service Studioユーザー・ガイド

E65365-05
目次へ
目次
索引へ移動
索引

前
次
機械翻訳について

プロジェクト・データのエクスポートについて

プロジェクト・ビューおよび「結果表」コンポーネントからデータをエクスポートできます。 エクスポートは、HDFSに格納するか、コンピュータにダウンロードできるデータに基づいてファイルを作成します。

エクスポートしたデータはプロジェクトの現在の絞込み状態に基づいているため、除外または非表示にされた属性は含まれません。 エクスポートされるデータの小さいサンプルと、エクスポート前に含められない属性のリストをプレビューできます。

プロジェクト・データをエクスポートする場合、ファイルをHDFSにエクスポートするか、コンピュータにエクスポートするかを指定する必要があります。 HDFSにエクスポートする場合は、ファイルを保存するディレクトリを指定する必要があります。 コンピュータにエクスポートすると、ファイルは生成されると自動的にダウンロードされます。

データのエクスポート先ファイルのタイプを選択する必要もあります。 これは、次のいずれかです。
  • デリミタ付き
  • Avro
  • Hive表。 このオプションは、HDFSへのエクスポート時にのみ使用できます。

注意:

エクスポート・データでは、デフォルトで属性表示名が使用されます。 ただし、Avroファイルにエクスポートする場合、無効なAvro文字を含む属性表示名は、属性キーに置き換えられます。

属性の置換

エクスポートするデータ・セットに複数値属性が含まれている場合は、値の一部またはすべてを置換できます。 置換された属性は、使用可能な値を表すブール属性のセットで置換されます。

注意:

Avroファイルにエクスポートする際に、属性を翻訳することはできません。
たとえば、色という名前の複数値属性で、一意の値赤、青および緑を使用するとします。 色属性を置換した場合、エクスポートされたデータで赤、青および緑というブール属性に置換されます。 当初色属性が赤、青に設定されていたレコードには、次が含まれています:
  • 赤い属性はTrueに設定されます。
  • 緑属性がFalseに設定されている場合
  • 青属性がTrueに設定された場合

複数値属性には多くの値を設定できるため、置換される各属性に追加される新しい列の数を制限できます。 上限に達するまで、列は最上位の値に対してのみ追加されます。

ASCII以外の属性値を表示中の問題

エクスポートするデータ・セットにASCII以外の属性が含まれる場合、CSVファイルを開くときにASCII以外の属性値が破損する可能性があります。 たとえば、このデータ破損の問題は、中国語、日本語および韓国語の属性値と、ASCII以外の言語エンコーディングで発生します。

この問題の回避方法:
  1. Studioからデータ・セットをエクスポートします。
  2. CSVファイルを開くのではなく、ファイルをローカルに保存します。
  3. Microsoft Excelを起動し、UTF-8エンコーディングを使用してCSVファイルをインポートします。 このオプションはExcelの「データ」 > 「テキストからの外部データの取得」 > 「インポート」の下にあり、インポート・ウィザードでUTF-8を選択します。
インポート後、属性値は正しくレンダリングされます。