Oracle Compute Cloud at Customerに関する外部データの問合せ

Exadata Cloud@Customer上のAutonomous Databaseデプロイメントが、データ・レイクのオブジェクトから外部表および外部パーティション表を構築して非構造化データをロード、問合せおよび管理できるようにするパッケージおよびツールについて説明します。

DBMS_CLOUDパッケージを使用して、Exadata Cloud@CustomerAutonomous Databaseデプロイメントを構成し、Oracle Compute Cloud at Customer (C3)オブジェクト・ストレージ・バケットに格納されている非構造化データにアクセスできます。

概要

構造化データおよび非構造化データからビジネス・インサイトを抽出できるデータ・プラットフォームが必要です。データ・ウェアハウスで使用可能な構造化データとデータ・レイクで使用可能な非構造化データの組合せは、データ・レイクハウスと呼ばれます。

自律型データレイクハウスは、構造化データと非構造化データの両方でデータ分析を可能にします。構造化データはAutonomous Data Warehouseに格納され、非構造化データはC3オブジェクト・ストレージ・バケットで構成されたデータ・レイクに格納されます。Autonomous Data Warehouseでは、DBMS_CLOUDというデータベース・パッケージを使用して、データ・レイク内のオブジェクトを問い合せ、ロードおよび管理できます。このパッケージを使用すると、Autonomous Databaseで、csv、txt、Avro、Parquetファイルなどのデータ・レイク・オブジェクトに外部および外部のパーティション表を作成できます。Autonomous Data Lakehouseを構築するには、Exadata Cloud@CustomerおよびOracle C3上のAutonomous Databaseデプロイメントの機能を組み合せます。

自律型データレイクハウスには、Autonomous Data Warehouseとデータレイクの2つの主要コンポーネントがあります。Autonomous Data Warehouseは、Exadata Cloud@Customer上のAutonomous Databaseデプロイメントを使用して構築され、データ・レイクはC3オブジェクト・ストレージ・バケットを使用して構築されます。Autonomous Databaseは構造化リレーショナル・データをホストしますが、データ・レイクは、txt、csv、Avro、Parquetおよびその他のファイル・タイプの形式で非構造化データのコレクションをホストします。Autonomous Databaseを問い合せると、データベースは、構造化データ、非構造化データまたは2つの組合せのいずれで結果を検索するかを決定します。DBMS_CLOUDパッケージを使用して、Exadata Cloud@CustomerAutonomous Databaseデプロイメントを構成し、データ・レイクのオブジェクトから外部パーティション表および外部パーティション表を構築することで、非構造化データをロード、問合せおよび管理できます。

前提条件

次のステップに従って、C3オブジェクト・ストレージ・バケットを構成し、様々なAutonomous Databaseコンポーネントをプロビジョニングします。C3オブジェクト・ストレージ・バケットと通信するようにAutonomous Databaseを構成する前に、これらのステップを完了する必要があります。
  • C3オブジェクト・ストレージ・バケットを作成します。
  • ユーザーとグループを作成します。グループにユーザーを追加し、必要なポリシーを構成して、ユーザーがC3オブジェクト・ストレージ・バケットへのファイル(追加/読取り/削除)を管理できるようにします。
    次に例を示します:
    Allow group <group_name> to manage objects in tenancy where
    target.bucket.name='<new_bucket_name_created>'
  • 作成したユーザーのAPIキーを作成します。APIキー生成プロセスから、user_ocidtenancy_ocidfingerprintregionの情報を確認します。さらに、APIキー生成プロセス中に作成された公開および非公開のPEMキー・ファイルを保存します。この情報は、後でDBMS_CLOUDパッケージを構成するために必要です。
  • 次に示すように、https認証局チェーンをダウンロードします。この認証局チェーンにより、クライアント・アプリケーションはhttpsプロトコルを介してC3オブジェクト・ストレージ・バケットを認証できます。https証明書は通常、crtファイルに保存されます(たとえば、c3_ca.crt)。https://iaas.domainname/cachainというURLをブラウザに指定して認証局チェーンを取得します。ここで、domainnameは、C3インフラストラクチャ・デプロイメント時に構成されたDNSドメインの名前です。
  • 新しいコンピュートVMを作成します。新しいVMが起動したら、前述のステップで作成したプライベートPEMキー・ファイルおよびC3 https証明書ファイルをVMにコピーします。
  • Exadata Infrastructureリソースを作成します。
  • Autonomous VMクラスタを作成します。
  • Autonomous Container Database (ACD)を作成します。
  • Autonomous Databaseを作成します。

C3オブジェクト・ストレージ・バケットと通信するためのAutonomous Databaseの構成

Autonomous DatabaseがC3オブジェクト・ストレージ・バケットと通信するには、次の2つのタスクを完了する必要があります:
  • Autonomous VM Cluster Grid Infrastructure TCPS Walletに、C3 Object Storageのhttps証明書を追加します。たとえば、ウォレットの場所は/var/opt/oracle/dbaas_acfs/grid/tcps_walletsです。これは、Autonomous DatabaseがC3オブジェクト・ストレージへのhttps接続を認証できるようにするために必要です。
  • 前述のACDのC##CLOUD$SERVICE_dbms_cloud_store表にエントリを追加します。これは、DBMS_CLOUDパッケージに、C3オブジェクト・ストレージ・バケットが有効なクラウド・ストアであることを通知するためです。これを行うためのSQLコマンドの例を次に示します。
    SQL>INSERT INTO C##CLOUD$SERVICE.dbms_cloud_store VALUES('ORACLE_BMC','<objectstorage.mydomain.com>',null,1);
Autonomous Databaseでは、通常のユーザーとして前述の2つのタスクを完了できません。Oracle Cloud Operationsは、通常ユーザーにかわってこれらの2つのタスクを実行する必要があります。2つのタスクを実行するには、My Oracle Support (MOS)にログインして、Oracle Cloud Operationsの新しいサポート・リクエストを作成する必要があります。チケットに次の情報を追加する必要があります。これらの値は、のステップの完了後に取得されます。
  • Exadataインフラストラクチャ・リソースのOCID
  • Autonomous VMクラスタのOCID
  • ACDのOCID
  • C3オブジェクト・ストレージのURL
  • C3オブジェクト・ストレージHTTPS証明書ファイル

クラウド操作で前述のタスクが完了したら、Autonomous Databaseにログインします。DBMS_CLOUD.CREATE_CREDENTIALプロシージャを使用して、C3オブジェクト・ストレージ・バケットへの接続に必要な認証情報をAutonomous Databaseに提供します。詳細は、CREATE_CREDENTIALを参照してください。