Oracle Compute Cloud at Customerに関する外部データの問合せ
Exadata Cloud@Customer上のAutonomous Databaseデプロイメントが、データ・レイクのオブジェクトから外部表および外部パーティション表を構築して非構造化データをロード、問合せおよび管理できるようにするパッケージおよびツールについて説明します。
DBMS_CLOUD
パッケージを使用して、Exadata Cloud@CustomerでAutonomous Databaseデプロイメントを構成し、Oracle Compute Cloud at Customer (C3)オブジェクト・ストレージ・バケットに格納されている非構造化データにアクセスできます。
概要
構造化データおよび非構造化データからビジネス・インサイトを抽出できるデータ・プラットフォームが必要です。データ・ウェアハウスで使用可能な構造化データとデータ・レイクで使用可能な非構造化データの組合せは、データ・レイクハウスと呼ばれます。
自律型データレイクハウスは、構造化データと非構造化データの両方でデータ分析を可能にします。構造化データはAutonomous Data Warehouseに格納され、非構造化データはC3オブジェクト・ストレージ・バケットで構成されたデータ・レイクに格納されます。Autonomous Data Warehouseでは、DBMS_CLOUD
というデータベース・パッケージを使用して、データ・レイク内のオブジェクトを問い合せ、ロードおよび管理できます。このパッケージを使用すると、Autonomous Databaseで、csv、txt、Avro、Parquetファイルなどのデータ・レイク・オブジェクトに外部および外部のパーティション表を作成できます。Autonomous Data Lakehouseを構築するには、Exadata Cloud@CustomerおよびOracle C3上のAutonomous Databaseデプロイメントの機能を組み合せます。
自律型データレイクハウスには、Autonomous Data Warehouseとデータレイクの2つの主要コンポーネントがあります。Autonomous Data Warehouseは、Exadata Cloud@Customer上のAutonomous Databaseデプロイメントを使用して構築され、データ・レイクはC3オブジェクト・ストレージ・バケットを使用して構築されます。Autonomous Databaseは構造化リレーショナル・データをホストしますが、データ・レイクは、txt、csv、Avro、Parquetおよびその他のファイル・タイプの形式で非構造化データのコレクションをホストします。Autonomous Databaseを問い合せると、データベースは、構造化データ、非構造化データまたは2つの組合せのいずれで結果を検索するかを決定します。DBMS_CLOUD
パッケージを使用して、Exadata Cloud@CustomerでAutonomous Databaseデプロイメントを構成し、データ・レイクのオブジェクトから外部パーティション表および外部パーティション表を構築することで、非構造化データをロード、問合せおよび管理できます。
前提条件
- C3オブジェクト・ストレージ・バケットを作成します。
- ユーザーとグループを作成します。グループにユーザーを追加し、必要なポリシーを構成して、ユーザーがC3オブジェクト・ストレージ・バケットへのファイル(追加/読取り/削除)を管理できるようにします。
次に例を示します:
Allow group <group_name> to manage objects in tenancy where target.bucket.name='<new_bucket_name_created>'
- 作成したユーザーのAPIキーを作成します。APIキー生成プロセスから、
user_ocid
、tenancy_ocid
、fingerprint
、region
の情報を確認します。さらに、APIキー生成プロセス中に作成された公開および非公開のPEMキー・ファイルを保存します。この情報は、後でDBMS_CLOUD
パッケージを構成するために必要です。 - 次に示すように、https認証局チェーンをダウンロードします。この認証局チェーンにより、クライアント・アプリケーションはhttpsプロトコルを介してC3オブジェクト・ストレージ・バケットを認証できます。https証明書は通常、crtファイルに保存されます(たとえば、
c3_ca.crt
)。https://iaas.domainname/cachain
というURLをブラウザに指定して認証局チェーンを取得します。ここで、domainname
は、C3インフラストラクチャ・デプロイメント時に構成されたDNSドメインの名前です。 - 新しいコンピュートVMを作成します。新しいVMが起動したら、前述のステップで作成したプライベートPEMキー・ファイルおよびC3 https証明書ファイルをVMにコピーします。
- Exadata Infrastructureリソースを作成します。
- Autonomous VMクラスタを作成します。
- Autonomous Container Database (ACD)を作成します。
- Autonomous Databaseを作成します。
C3オブジェクト・ストレージ・バケットと通信するためのAutonomous Databaseの構成
- Autonomous VM Cluster Grid Infrastructure TCPS Walletに、C3 Object Storageのhttps証明書を追加します。たとえば、ウォレットの場所は
/var/opt/oracle/dbaas_acfs/grid/tcps_wallets
です。これは、Autonomous DatabaseがC3オブジェクト・ストレージへのhttps接続を認証できるようにするために必要です。 - 前述のACDの
C##CLOUD$SERVICE_dbms_cloud_store
表にエントリを追加します。これは、DBMS_CLOUD
パッケージに、C3オブジェクト・ストレージ・バケットが有効なクラウド・ストアであることを通知するためです。これを行うためのSQLコマンドの例を次に示します。SQL>INSERT INTO C##CLOUD$SERVICE.dbms_cloud_store VALUES('ORACLE_BMC','<objectstorage.mydomain.com>',null,1);
- Exadataインフラストラクチャ・リソースのOCID
- Autonomous VMクラスタのOCID
- ACDのOCID
- C3オブジェクト・ストレージのURL
- C3オブジェクト・ストレージHTTPS証明書ファイル
クラウド操作で前述のタスクが完了したら、Autonomous Databaseにログインします。DBMS_CLOUD.CREATE_CREDENTIAL
プロシージャを使用して、C3オブジェクト・ストレージ・バケットへの接続に必要な認証情報をAutonomous Databaseに提供します。詳細は、CREATE_CREDENTIALを参照してください。