ディレクトリへのParquetとしてのデータのエクスポート
問合せを指定して、Autonomous AI DatabaseからParquetデータとしてディレクトリに表データをエクスポートするステップを示します。
-
Autonomous AI Databaseインスタンスに接続します。
詳細は、Autonomous AI Databaseへの接続を参照してください。
-
ディレクトリの作成
たとえば:
CREATE DIRECTORY export_dir AS 'export_dir';詳細は、Autonomous AI Databaseでのディレクトリの作成を参照してください。
-
DBMS_CLOUD.EXPORT_DATAを実行し、formatパラメータtypeを値jsonとともに指定して、結果をParquetファイルとしてディレクトリにエクスポートします。出力をディレクトリに送信する場合は、credentialパラメータを含めないでください。BEGIN DBMS_CLOUD.EXPORT_DATA( file_uri_list => 'export_dir:sales.parquet', format => JSON_OBJECT('type' value 'parquet'), query => 'SELECT * FROM sales' ); END; /ディレクトリ名が二重引用符で囲まれている場合、ディレクトリ名は大/小文字が区別されます。たとえば:
BEGIN DBMS_CLOUD.EXPORT_DATA( file_uri_list => '"export_dir":sales.parquet', format => JSON_OBJECT('type' value 'parquet'), query => 'SELECT * FROM sales' ); END; /パラメータの詳細は、「EXPORT_DATAプロシージャ」を参照してください。
DBMS_CLOUD.EXPORT_DATAで使用できるformatパラメータの詳細は、「EXPORT_DATAのDBMS_CLOUDパッケージのフォーマット・オプション」を参照してください。パラメータは次のとおりです。
-
file_uri_list: エクスポート・ファイルのカンマ区切りリストです。file_uri_listでは、ワイルドカードおよび置換文字の使用はサポートされていません。 -
format: 必要なtypeパラメータを指定します。有効な値は、datapump、json、xml、csvおよびparquetで、ORACLE_DATAPUMPアクセス・ドライバを使用してエクスポートに指定できるオプションもオプションで定義します。 -
query: 必要なデータのみがエクスポートされるようにSELECT文を指定します。問合せによってダンプ・ファイルの内容が決定されます。
パラメータの詳細は、「EXPORT_DATAプロシージャ」を参照してください。
-
DBMS_CLOUD.EXPORT_DATAを使用したエクスポートに関するノート:
-
指定する
queryパラメータには、必要に応じて、結合や副問合せを含む問合せなどの拡張問合せを指定できます。 -
出力ファイルを圧縮するには、
formatパラメータをcompressionオプションとともに指定します。 -
Oracle型からParquet型へのマッピングの詳細は、「DBMS_CLOUDパッケージのOracleデータ型からParquetへのマッピング」を参照してください。
次の型はサポートされていないか、
DBMS_CLOUD.EXPORT_DATAでParquetをエクスポートするためのサポートに制限があります。Oracleタイプ ノート BFILEサポートされていない BLOBサポートされていない DATE次の制限でサポート:
DATE形式では、日付、月および年のみがサポートされます。時間、分および秒はサポートされていません。DATEをParquetにエクスポートする場合のNLS形式制限の詳細は、「DBMS_CLOUDパッケージのOracleデータ型からParquetへのマッピング」を参照してください。INTERVAL DAY TO SECONDサポートされ、内部で文字列として扱われます INTERVAL YEAR TO MONTHサポートされ、内部で文字列として扱われます LONGサポートされていない LONG RAWサポートされていない NUMBER次の制限でサポートされています。
- 最大精度は38で、倍率は精度以下になります。
- 列
NUMBER型に精度およびスケールが指定されていない場合は、デフォルトで精度38およびスケール20が使用されます。 NUMBER型では負のスケールはサポートされていません。
Object Typesサポートされていない TIMESTAMP次の制限でサポートされています。
- 精度が異なる複数の列がある場合は、最高精度が使用されます。
TIMESTAMP WITH TIME ZONEOracleデータ型では、タイムスタンプのみが使用されます。
TIMESTAMPをParquetにエクスポートする場合のNLS形式制限の詳細は、「DBMS_CLOUDパッケージのOracleデータ型からParquetへのマッピング」を参照してください。