Oracle Compute Cloud at Customerでの外部データの問合せ
Exadata Cloud@Customer上のAutonomous AI Databaseデプロイメントが、データ・レイクのオブジェクトから外部表および外部パーティション表を構築することで非構造化データをロード、問合せおよび管理できるようにするパッケージおよびツールについて説明します。
DBMS_CLOUDパッケージを使用して、Exadata Cloud@CustomerでAutonomous AI Databaseデプロイメントを構成し、Oracle Compute Cloud at Customer (C3)オブジェクト・ストレージ・バケットに格納されている非構造化データにアクセスできます。
概要
構造化データおよび非構造化データからビジネス・インサイトを抽出できるデータ・プラットフォームが必要です。データ・ウェアハウスで使用可能な構造化データと、データ・レイクで使用可能な非構造化データの組合せは、データ・レイクハウスと呼ばれます。
Autonomous Data Lakehouseは、構造化データと非構造化データの両方に対するデータ分析を可能にします。構造化データはAutonomous AI Lakehouseに格納され、非構造化データはC3 Object Storage Bucketsで構成されたデータレイクに格納されます。Autonomous AI Lakehouseは、DBMS_CLOUDというデータベース・パッケージを使用して、データレイク内のオブジェクトを問い合せ、ロードおよび管理できます。このパッケージにより、Autonomous AI Databaseは、csv、txt、Avro、Parquetファイルなどのデータレイク・オブジェクトに外部および外部のパーティション表を作成できます。Autonomous Data Lakehouseは、Exadata Cloud@CustomerおよびOracle C3上のAutonomous AI Databaseデプロイメントの機能を組み合せることで構築できます。
Autonomous Data Lakehouseには、Autonomous AI LakehouseとData Lakeの2つの主要コンポーネントがあります。Autonomous AI Lakehouseは、Exadata Cloud@Customer上のAutonomous AI Databaseデプロイメントを使用して構築され、データレイクはC3 Object Storageバケットを使用して構築されます。Autonomous AI Databaseは構造化リレーショナル・データをホストし、Data Lakeは、txt、csv、Avro、Parquetおよびその他のファイル・タイプの形式で非構造化データのコレクションをホストします。Autonomous AI Databaseを問い合せると、データベースによって、構造化データ、非構造化データ、またはその2つの組合せのいずれにおいても、結果の検索場所が決定されます。DBMS_CLOUDパッケージを使用して、Exadata Cloud@CustomerでAutonomous AI Databaseデプロイメントを構成し、データ・レイク内のオブジェクトから外部および外部パーティション表を構築することで、非構造化データをロード、問合せおよび管理できます。
前提条件
次のステップに従って、C3オブジェクト・ストレージ・バケットを構成し、様々なAutonomous AI Databaseコンポーネントをプロビジョニングします。C3オブジェクト・ストレージ・バケットと通信するようにAutonomous AI Databaseを構成する前に、次のステップを完了する必要があります。
-
C3オブジェクト・ストレージ・バケットを作成します。
-
ユーザーとグループを作成します。ユーザーをグループに追加し、C3オブジェクト・ストレージ・バケットへのファイル(追加/読取り/削除)の管理をユーザーに許可するために必要なポリシーを構成します。
次に例を示します:
Allow group <group_name> to manage objects in tenancy where target.bucket.name='<new_bucket_name_created>' -
作成されたユーザーのAPIキーを作成します。APIキー生成プロセスから、
user_ocid、tenancy_ocid、fingerprint、regionの情報に注意してください。さらに、APIキー生成プロセス中に作成された公開および非公開の PEM鍵ファイルを保存します。この情報は、後でDBMS_CLOUDパッケージを構成するために必要です。 -
次に示すように、https認証局チェーンをダウンロードします。この認証局チェーンにより、クライアント・アプリケーションはHTTPSプロトコルを介してC3オブジェクト・ストレージ・バケットを認証できます。通常、https証明書は、
c3_ca.crtなどのcrtファイルに保存されます。ブラウザにhttps://iaas.domainname/cachainというURLを指定して、認証局チェーンを取得します。ここで、domainnameは、C3インフラストラクチャのデプロイメント中に構成されたDNSドメインの名前です。 -
新しいコンピュートVMを作成します。新しいVMが起動したら、プライベートPEMキー・ファイルと、前述のステップで作成したC3 https証明書ファイルをVMにコピーします。
-
Exadata Infrastructureリソースを作成します。
-
Autonomous VMクラスタを作成します。
-
Autonomous AI Databaseを作成します。
C3オブジェクト・ストレージ・バケットと通信するためのAutonomous AI Databaseの構成
Autonomous AI DatabaseがC3オブジェクト・ストレージ・バケットと通信するには、次の2つのタスクを完了する必要があります:
-
Autonomous VM Cluster Grid Infrastructure TCPS WalletにC3 Object Storageのhttps証明書を追加します。たとえば、ウォレットの場所は
/var/opt/oracle/dbaas_acfs/grid/tcps_walletsです。これは、Autonomous AI DatabaseがC3オブジェクト・ストレージへのhttps接続を認証できるようにするために必要です。 -
上で作成したACDの
C##CLOUD$SERVICE_dbms_cloud_store表にエントリを追加します。これは、C3 Object Storageバケットが有効なクラウド・ストアであることをDBMS_CLOUDパッケージに通知するものです。これを行うためのSQLコマンドの例を次に示します。SQL>INSERT INTO C##CLOUD$SERVICE.dbms_cloud_store VALUES('ORACLE_BMC','<objectstorage.mydomain.com>',null,1);
Autonomous AI Databaseでは、前述の2つのタスクを通常のユーザーとして完了することはできません。Oracle Cloud Operationsは、通常ユーザーのかわりにこの2つのタスクを実行する必要があります。2つのタスクを実行するには、My Oracle Support (MOS)にログインして、Oracle Cloud Operationsの新しいサポート・リクエストを作成する必要があります。チケットに次の情報を追加する必要があります。の手順を完了すると、これらの値が表示されます。
-
Exadataインフラストラクチャ・リソースのOCID
-
Autonomous VMクラスタのOCID
-
ACDのOCID
-
C3オブジェクト・ストレージURL
-
C3オブジェクト・ストレージHTTPS証明書ファイル
クラウド操作で前述のタスクが完了したら、Autonomous AI Databaseにログインします。DBMS_CLOUD.CREATE_CREDENTIALプロシージャを使用して、C3オブジェクト・ストレージ・バケットへの接続に必要な認証情報をAutonomous AI Databaseに提供します。詳細は、CREATE_CREDENTIALを参照してください。