Oracle Big Data SQL 4.0での変更点

Oracle Database 18cのサポート、およびOracle Database 12.2および12.1の下位互換性

Oracle Big Data SQL 4.0の新機能を利用するには、Oracle Database 18c以上を使用する必要があります。ただし、Oracle Database 12.1および12.2の使用は完全にサポートされています(これらのデータベース・バージョンで4.0の新機能は利用できません)。この下位互換性により、Oracle Database 18cと12cの両方が混在する環境にリリース4.0をインストールして管理できます。

Big Data SQL問合せサーバー

Big Data SQL問合せサーバーは、軽量でゼロ・メンテナンスのOracle Databaseです。これにより、機能フル装備のOracle Databaseサービスがなくても、Hadoopのデータを簡単に問い合せることができます。このサービスは、Oracle SQL問合せエンジンのみで構成されています。セッション間で保持するのに便利なメタデータの特定のカテゴリを除いて、永続記憶域が提供されません。

自動でインストールし、メンテナンスは不要

Big Data SQL問合せサーバーは、標準のOracle Big Data SQLインストールの一部として含まれています。指定する必要があるのは、サービスをインストールするエッジ・ノードのアドレスのみです。インストール自体は完全に自動化されているため、インストール後の構成は必要ありません。
シングルユーザー・モードとマルチユーザー・モードを提供

このサービスには、シングルユーザーとマルチユーザーの2つのモードがあります。シングルユーザー・モードでは、問合せサーバーへのアクセスにシングルユーザーを使用します。すべてのユーザーは、インストール中に指定されたパスワードを使用して、BDSQLユーザーとして問合せサーバーに接続します。マルチユーザー・モードでは、Hadoopクラスタ・ユーザーは、Kerberosプリンシパルを使用して問合せサーバーにログインします。
Kerberosと連携して自動的にKerberosプリンシパルをインポート

Kerberosで保護されたクラスタは、シングルユーザー・モードとマルチユーザー・モードの両方をサポートできます。

保護されたクラスタへのインストール中に、インストーラは自動的にKDCに問い合せてKerberosプリンシパルを識別し、このプリンシパルに基づいて外部で識別されたユーザーを設定します。インストール後、管理者は手動でプリンシパルを追加または削除できます。
各問合せサーバーの再起動後に初期状態にリセット

Big Data SQL問合せサーバーが再起動されるたびに、データベース・インスタンスは元の状態にリセットされます。これは、致命的なエラーが発生した場合にも行われます。このリセットにより、白紙の状態から再開できます。再起動では、外部表(ORACLE_HIVEタイプとHDFSタイプの両方)、関連する統計およびユーザー定義ビューが保持されます。再起動により、ユーザー・データが含まれている標準の表が削除されます
Hortonworks AmbariまたはCloudera Managerを介して管理可能

Big Data SQL問合せサービスは、AmbariまたはCloudera Managerでサービスとして自動的に設定されます。これらの管理ツールを使用して、プロセスの監視と停止/開始、警告、エラーおよび情報メッセージの表示、いくつかのBig Data SQL問合せサービスの操作(統計収集やHiveメタデータのインポートなど)の実行を行うことができます。

問合せサーバーは、Oracle Big Data SQLインストレーション・ガイドのOracle Big Data SQLのライセンスで説明されている制限付き使用ライセンスで提供されています。

オブジェクト・ストアにアクセスするための新規ORACLE_BIGDATAドライバ

リリース4.0には、ORACLE_HIVEおよびORACLE_HDFSに加えて、新しいORACLE_BIGDATAドライバも含まれています。このドライバを使用すると、クラウドのオブジェクト・ストア内のデータに対して外部表を作成できます。現時点では、Oracle Object StoreおよびAmazon S3がサポートされています。ORACLE_BIGDATAでは、これらの環境でParquet、Avroおよびテキスト・ファイルに対して外部表を作成できます。開発およびテストでは、これを使用してOracle Databaseディレクトリ・オブジェクトを介してローカル・データ・ファイルにアクセスすることもできます。ドライバはCで記述され、Javaコードは実行されません。

リリース4.0では、ORACLE_BIGDATAはParquetファイルのスカラー・フィールドの戻り値をサポートしています。現時点では、より複雑なデータ型やマルチパートParquetファイルはサポートされていません。リーダーがParquetファイルの複雑なデータ型をサポートしていないため、生成された列リストでは外部表定義の複雑な列が省略されます。Parquetファイルに格納されているほとんどの型は、Oracle表の列の型として直接サポートされていません。

新しい集計オフロード機能などOracle Big Data SQLのSmart Scanは、データをオブジェクト・ストアからOracle Big Data SQLがインストールされているHadoopクラスタの処理セルにオフロードして、オブジェクト・ストアを操作します。

オブジェクト・ストアに対する認証は、DBMS_CREDENTIALパッケージを使用して作成した資格証明オブジェクトを介して行われます。外部表作成の文のパラメータとして資格証明オブジェクトの名前および場所URIを含めます。