Autonomous AI Databaseを使用した外部データのクエリ
Autonomous AI Databaseでデータを問い合せ、検証するためのパッケージおよびツールについて説明します。
外部データはデータベースによって管理されませんが、DBMS_CLOUDプロシージャを使用して外部データを問い合せるすることはできます。外部データの問合せはデータベース表の問合せほど高速ではありませんが、この方法を使用すると、外部ソース・ファイルおよび外部データの問合せの実行をすばやく開始できます。外部表のタイプに応じて、DBMS_CLOUD検証プロシージャを使用して外部データを検証できます。データ検証プロシージャを使用すると、外部表のソース・ファイルを検証して、問題を識別し、外部表のデータを修正したり、データを使用する前に無効なデータを除外したりできます。
ノート
ノート: ADMINユーザーを使用していない場合は、ユーザーが実行する必要がある操作に対する必要な権限を持っていることを確認してください。詳細は、Autonomous AI Databaseでのユーザー権限の管理- クライアント・ツールを使用した接続を参照してください。
-
クラウドのファイルのデータを問合せるには、まず、オブジェクト・ストレージ資格証明をAutonomous AI Databaseに格納してから、PL/SQLプロシージャ
DBMS_CLOUD.CREATE_EXTERNAL_TABLEを使用して外部表を作成する必要があります。 -
外部表を使用したオブジェクト・ストレージのJSONデータの問合せ
Autonomous AI Databaseでは、外部表を使用して、Oracle Cloud Infrastructure Object Storageに格納されているJSONドキュメントにアクセスできます。
-
ORC、ParquetまたはAvroソース・ファイルを使用した外部データの問合せ Autonomous AI Databaseにより、外部表を使用してオブジェクト・ストアに格納されているORC、ParquetまたはAvroデータに簡単にアクセスできるようになります。ORC、ParquetおよびAvroソースにはメタデータが埋め込まれています。プロシージャ
DBMS_CLOUD.CREATE_EXTERNAL_TABLEは、このメタデータを利用して外部表の作成を簡略化できます。 -
Autonomous AI Databaseでは、Hiveスタイルのパーティション化されたデータまたはクラウド・オブジェクト・ストアに格納されている単純なフォルダ・パーティション化されたデータから、暗黙的なパーティション化された外部表を作成できます。
-
ソース・ファイルにパーティションが指定されている外部表の問合せオブジェクト・ストア内の複数のデータ・ファイルを単一の外部表として問い合せる際に、これらのファイルを複数の論理パーティションとして表せる場合は、外部パーティション表を使用することを強くお薦めします。外部パーティション表を使用すると、問合せアクセス用のデータ・ファイルの論理パーティションが保持されます。
-
外部パーティション・データの問合せ(Partitioning句)
オブジェクト・ストア内の複数のデータ・ファイルを単一の外部表として問い合せるときに、これらのファイルを複数の論理パーティションとして表すことができる場合は、外部パーティション表を使用することを強くお薦めします。外部パーティション表を使用すると、問合せアクセス用のデータ・ファイルの論理パーティションが保持されます。
DBMS_CLOUD.CREATE_EXTERNAL_PART_TABLEプロシージャを使用して、外部パーティション表を作成します。 -
Autonomous AI Database Tableハイパーリンクを介して外部表を作成できます。
-
ハイブリッド・パーティション・データの問合せオブジェクト・ストア内の内部データおよび複数のデータ・ファイルを単一の論理表として問い合せるには、ハイブリッド・パーティション表を使用してデータを単一のオブジェクトとして表できます。プロシージャ
DBMS_CLOUD.CREATE_HYBRID_PART_TABLEを使用して、ハイブリッド・パーティション表を作成する。 -
DBMS_CLOUD.CREATE_EXTERNAL_TABLEを使用して外部表を作成することで、クラウド内のOracle Data Pumpダンプ・ファイルを問い合せることができることもできます。 -
Autonomous AI DatabaseからのBig Data Service Hadoop (HDFS)データの問合せ Autonomous AI DatabaseからOracle Big Data Serviceへのデータベース・リンクを作成できます。
-
Oracle Cloud Infrastructure Data Catalogは、Oracle Cloudのメタデータ管理サービスであり、データの検出およびデータ・ガバナンスのサポートに役立ちます。アセットのインベントリ、ビジネス用語集、およびデータ・レイクの共通メタストアを提供します。
-
AWS Glueデータ・カタログを使用した外部データの問合せ
Autonomous AI Databaseは、Amazon AWS Glue Data Catalogインスタンスと同期するためのシステムをサポートしています。
-
Autonomous AI Databaseは、Apache Icebergテーブルのクエリをサポートしています。
-
外部表を検証するには、プロシージャ
DBMS_CLOUD.VALIDATE_EXTERNAL_TABLEを使用します。 -
外部パーティション表を検証するには、
DBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLEプロシージャを使用できます。このプロシージャには、検証する特定のパーティションを指定できるパラメータが含まれています。 -
ハイブリッド・パーティション・データの検証ハイブリッド・パーティション表を検証するには、
DBMS_CLOUD.VALIDATE_HYBRID_PART_TABLEプロシージャを使用できます。このプロシージャには、検証する特定のパーティションを指定できるパラメータが含まれています。 -
外部表を検証するには、
DBMS_CLOUD.VALIDATE_EXTERNAL_TABLEプロシージャ、DBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLEプロシージャおよびDBMS_CLOUD.VALIDATE_HYBRID_PART_TABLEプロシージャを使用します。