3.1 Hadoopおよびハイブリッド・パーティション表への格納について
Oracle Big Data SQLのリソースでは、Oracle Databaseの表をオフロードするための様々な方法がサポートされています。これらの方法としては、ハイブリッド・パーティション表(HPT)への格納や、HDFS内のOracle Database表領域への格納などがあります。
Oracle Copy to Hadoopティリティを使用すると、Oracle DatabaseからHadoopにデータを効率的に移動できます。このデータはデータ・ポンプ形式で格納され、Big Data SQL、およびクラスタ上のネイティブHadoopツールの両方で問合せできます。Copy to Hadoopの使用を参照してください。
次の表では、ハイブリッド・パーティション表にデータを格納する場合とHDFS内のOracle Database表領域にデータを格納する場合とでオフロード方法と比較します。
表3-1 オフロード方法の比較
ハイブリッド・パーティション表への格納 | HDFS内のOracle表領域 |
---|---|
古典的な内部パーティション表は、Oracleの外部パーティション表と結合されてハイブリッド・パーティション表となります。パーティション化では、より管理しやすい小さい単位に表が分割されます。これにより、パフォーマンスが向上し、低コストのストレージにデータをオフロードできます。 | Oracle Databaseの表またはパーティションは、元のOracle内部形式でHDFSの表領域内に格納されます。 |
外部パーティションへのアクセスでは、既存のすべての表タイプ、およびORACLE_HDFS、ORACLE_HIVE、ORACLE_BIGDATAアクセス・ドライバがサポートされています。
HPTでは、Copy to Hadoopデータ・ポンプ・ファイルのみでなく、Parquet、ORC、CSVなど、従来のHadoopファイル・タイプのデータを指すこともできます。 |
元のOracle Database表からの直接アクセス。外部表は不要です。 |
データには、Oracle Database以外のツールでアクセスできます。データはCSV、Parquet、AvroおよびORC形式で使用できるため、ビッグ・データ・テクノロジにシームレスにアクセスできます。HPTでは、データを自分のアプリケーションに最適な形式で格納できます。
ハイブリッド・パーティション表へのアクセスの有効化を参照してください。 |
データは、Oracle Databaseでのみ直接使用できます。データは、Hadoopの他のプロセスでアクセスできません。
HDFSへのOracle表領域の格納を参照してください。 |