Oracle Compute Cloud at Customerに関する外部データの問合せ
Exadata Cloud@Customer上のAutonomous AI Databaseデプロイメントが、データ・レイクのオブジェクトから外部表および外部パーティション表を構築して非構造化データをロード、問合せおよび管理できるようにするパッケージおよびツールについて説明します。
DBMS_CLOUDパッケージを使用して、Exadata Cloud@CustomerでAutonomous AI Databaseデプロイメントを構成し、Oracle Compute Cloud at Customer (C3)オブジェクト・ストレージ・バケットに格納されている非構造化データにアクセスできます。
概要
構造化データおよび非構造化データからビジネス・インサイトを抽出できるデータ・プラットフォームが必要です。データ・ウェアハウスで使用可能な構造化データとデータ・レイクで使用可能な非構造化データの組合せは、データ・レイクハウスと呼ばれます。
自律型データレイクハウスは、構造化データと非構造化データの両方でデータ分析を可能にします。構造化データはAutonomous AI Lakehouseに格納され、非構造化データはC3 Object Storage Bucketsで構成されたデータ・レイクに格納されます。Autonomous AI Lakehouseでは、DBMS_CLOUDというデータベース・パッケージを使用して、データレイク内のオブジェクトを問い合せ、ロードおよび管理できます。このパッケージを使用すると、Autonomous AI Databaseで、csv、txt、Avro、Parquetファイルなどのデータ・レイク・オブジェクトに外部および外部のパーティション表を作成できます。Autonomous Data Lakehouseを構築するには、Exadata Cloud@CustomerおよびOracle C3上のAutonomous AI Databaseデプロイメントの機能を組み合せます。
自律型データレイクハウスには、自律型AIレイクハウスとデータレイクの2つの主要コンポーネントがあります。Autonomous AI Lakehouseは、Exadata Cloud@Customer上のAutonomous AI Databaseデプロイメントを使用して構築され、データレイクはC3オブジェクト・ストレージ・バケットを使用して構築されます。Autonomous AI Databaseは構造化リレーショナル・データをホストし、データレイクは、txt、csv、Avro、Parquetおよびその他のファイル・タイプの形式で非構造化データのコレクションをホストします。Autonomous AI Databaseを問い合せると、データベースは、構造化データ、非構造化データまたは2つの組合せのいずれで結果を検索するかを決定します。DBMS_CLOUDパッケージを使用して、Exadata Cloud@CustomerでAutonomous AI Databaseデプロイメントを構成し、データ・レイクのオブジェクトから外部および外部パーティション表を構築することで、非構造化データをロード、問合せおよび管理できます。
前提条件
- C3オブジェクト・ストレージ・バケットを作成します。
- ユーザーとグループを作成します。グループにユーザーを追加し、必要なポリシーを構成して、ユーザーがC3オブジェクト・ストレージ・バケットへのファイル(追加/読取り/削除)を管理できるようにします。
次に例を示します:
Allow group <group_name> to manage objects in tenancy where target.bucket.name='<new_bucket_name_created>' - 作成したユーザーのAPIキーを作成します。APIキー生成プロセスから、
user_ocid、tenancy_ocid、fingerprint、regionの情報を確認します。さらに、APIキー生成プロセス中に作成された公開および非公開のPEMキー・ファイルを保存します。この情報は、後でDBMS_CLOUDパッケージを構成するために必要です。 - 次に示すように、https認証局チェーンをダウンロードします。この認証局チェーンにより、クライアント・アプリケーションはhttpsプロトコルを介してC3オブジェクト・ストレージ・バケットを認証できます。https証明書は通常、crtファイルに保存されます(たとえば、
c3_ca.crt)。https://iaas.domainname/cachainというURLをブラウザに指定して認証局チェーンを取得します。ここで、domainnameは、C3インフラストラクチャ・デプロイメント時に構成されたDNSドメインの名前です。 - 新しいコンピュートVMを作成します。新しいVMが起動したら、前述のステップで作成したプライベートPEMキー・ファイルおよびC3 https証明書ファイルをVMにコピーします。
- Exadata Infrastructureリソースを作成します。
- Autonomous VMクラスタを作成します。
- Autonomous Container Database (ACD)を作成します。
- Autonomous AI Databaseを作成します。
C3オブジェクト・ストレージ・バケットと通信するためのAutonomous AI Databaseの構成
- Autonomous VM Cluster Grid Infrastructure TCPS Walletに、C3 Object Storageのhttps証明書を追加します。たとえば、ウォレットの場所は
/var/opt/oracle/dbaas_acfs/grid/tcps_walletsです。これは、Autonomous AI DatabaseがC3オブジェクト・ストレージへのhttps接続を認証できるようにするために必要です。 - 前述のACDの
C##CLOUD$SERVICE_dbms_cloud_store表にエントリを追加します。これは、DBMS_CLOUDパッケージに、C3オブジェクト・ストレージ・バケットが有効なクラウド・ストアであることを通知するためです。これを行うためのSQLコマンドの例を次に示します。SQL>INSERT INTO C##CLOUD$SERVICE.dbms_cloud_store VALUES('ORACLE_BMC','<objectstorage.mydomain.com>',null,1);
- Exadataインフラストラクチャ・リソースのOCID
- Autonomous VMクラスタのOCID
- ACDのOCID
- C3オブジェクト・ストレージのURL
- C3オブジェクト・ストレージHTTPS証明書ファイル
クラウド操作で前述のタスクが完了したら、Autonomous AI Databaseにログインします。DBMS_CLOUD.CREATE_CREDENTIALプロシージャを使用して、C3オブジェクト・ストレージ・バケットへの接続に必要な認証情報をAutonomous AI Databaseに提供します。詳細は、CREATE_CREDENTIALを参照してください。