3.1 Hadoopおよびハイブリッド・パーティション表への格納について

Oracle Big Data SQLのリソースでは、Oracle Databaseの表をオフロードするための様々な方法がサポートされています。これらの方法としては、ハイブリッド・パーティション表(HPT)への格納や、HDFS内のOracle Database表領域への格納などがあります。

Oracle Copy to Hadoopティリティを使用すると、Oracle DatabaseからHadoopにデータを効率的に移動できます。このデータはデータ・ポンプ形式で格納され、Big Data SQL、およびクラスタ上のネイティブHadoopツールの両方で問合せできます。Copy to Hadoopの使用を参照してください。

次の表では、ハイブリッド・パーティション表にデータを格納する場合とHDFS内のOracle Database表領域にデータを格納する場合とでオフロード方法と比較します。

表3-1 オフロード方法の比較

ハイブリッド・パーティション表への格納 HDFS内のOracle表領域
古典的な内部パーティション表は、Oracleの外部パーティション表と結合されてハイブリッド・パーティション表となります。パーティション化では、より管理しやすい小さい単位に表が分割されます。これにより、パフォーマンスが向上し、低コストのストレージにデータをオフロードできます。 Oracle Databaseの表またはパーティションは、元のOracle内部形式でHDFSの表領域内に格納されます。
外部パーティションへのアクセスでは、既存のすべての表タイプ、およびORACLE_HDFS、ORACLE_HIVE、ORACLE_BIGDATAアクセス・ドライバがサポートされています。

HPTでは、Copy to Hadoopデータ・ポンプ・ファイルのみでなく、Parquet、ORC、CSVなど、従来のHadoopファイル・タイプのデータを指すこともできます。

元のOracle Database表からの直接アクセス。外部表は不要です。
データには、Oracle Database以外のツールでアクセスできます。データはCSV、Parquet、AvroおよびORC形式で使用できるため、ビッグ・データ・テクノロジにシームレスにアクセスできます。HPTでは、データを自分のアプリケーションに最適な形式で格納できます。

ハイブリッド・パーティション表へのアクセスの有効化を参照してください。

データは、Oracle Databaseでのみ直接使用できます。データは、Hadoopの他のプロセスでアクセスできません。

HDFSへのOracle表領域の格納を参照してください。