4.6 Apache Hiveへのデータのインポート

Oracle Big Data Managerコンソールの「Data」セクションでは、.csvファイル、Apache AvroファイルおよびApache ParquetファイルをHDFSからOracle Big Data Managerを実行しているクラスタのHiveServer2にインポートできます。

サポートされているファイルをHiveにインポートするには:
  1. ページ上部にある「Data」タブをクリックしてから、ページの左側の「Explorer」タブをクリックします。
  2. どちらかのパネルの「Storage」ドロップダウン・リストから、「HDFS storage (hdfs)」を選択します。

    Apache Hiveのインポートは、ファイルとその親ディレクトリのアクセス権によって機能しない場合があります。その場合は、ファイルを/tmpディレクトリにコピーまたは移動して、そこからインポートできます。

  3. インポートするファイルに移動して右クリックし、「Import to Apache Hive」を選択して、インポート方法の「Import as CSV」「Import as Apache Avro」または「Import as Apache Parquet」を選択します。
  4. インポートの詳細を指定します。
    • 「Import as CSV」の場合は、「Create a new job」ウィザードの各タブで値を指定して、「Create」をクリックします。
    • 「Import as Apache Avro」および「Import as Apache Parquet」の場合は、「Table name」フィールドでHive表を指定して、「Database name」ドロップダウン・リストからHiveデータベースを選択します。表名は、インポートに選択したファイルの名前にデフォルト設定されます。データベースは、default Hiveデータベースにデフォルト設定されます。別のデータベースがHiveメタストアに作成されている場合は、それらのデータベースもドロップダウン・リストに表示されます。「Import to Hive」をクリックします。