1.1 Oracle外部表について
Oracle Big Data SQLによって、外部表のパフォーマンスが大幅に向上します。外部表は、データベース外のデータの場所を識別および記述するOracle Databaseオブジェクトです。他のデータベース表に使用するのと同じSQL SELECT
構文を使用して、外部表を問い合せることができます。
Big Data SQLでは、ファンアウトの並列性が使用されることで、外部表での処理の拡張性が非常に高まります。たとえば、Big Data SQLの外部表に対するシリアル問合せでは、Hadoopクラスタの並列処理能力が利用されます。
外部表はアクセス・ドライバを使用して、データベース外のデータを解析します。様々なソースからのデータを処理する複数の外部データ・ドライバが存在します。1つ目はORACLE_HIVEであり、これは、Apache Hiveで定義されているメタデータを利用します。2つ目はORACLE_HDFSであり、これは、HDFS内のデータに直接アクセスします(外部表定義の一部としてメタデータを指定)。3つ目はORACLE_BIGDATAであり、これは、Object Storage内のデータにアクセスします。HDFSと同様に、メタデータは表定義の一部です。