Daten als Parquet in Cloud-Objektspeicher exportieren

Zeigt die Schritte zum Exportieren von Tabellendaten aus Autonomous Database in den Cloud-Objektspeicher als Parquet-Daten durch Angabe einer Abfrage.

Diese Exportmethode unterstützt alle von Autonomous Database unterstützten Cloud-Objektspeicher. Sie können mit einem Oracle Cloud Infrastructure-Resource Principal auf Ihren Oracle Cloud Infrastructure-Objektspeicher, mit Amazon-Ressourcennamen (ARNs) auf AWS Simple Storage Service (S3), mit einem Azure-Service-Principal für den Zugriff auf Azure-BLOB-Speicher oder mit Azure-Data Lake-Speicher oder mit einem Google-Serviceaccount für den Zugriff auf Google Cloud Platform-(GCP-)Ressourcen zugreifen.

  1. Melden Sie sich bei Ihrer Autonomous Database-Instanz an.

    Weitere Informationen finden Sie unter Verbindung zu Autonomous Database herstellen.

  2. Speichern Sie die Zugangsdaten für den Cloudobjektspeicher mit DBMS_CLOUD.CREATE_CREDENTIAL.

    Beispiele:

    BEGIN
      DBMS_CLOUD.CREATE_CREDENTIAL(
        credential_name => 'DEF_CRED_NAME',
        username => 'user1@example.com',
        password => 'password'
      );
    END;
    /

    Die Werte, die Sie für username und password angeben, hängen vom verwendeten Cloud-Objektspeicherservice ab.

    Das Erstellen von Zugangsdaten für den Zugriff auf Oracle Cloud Infrastructure Object Storage ist nicht erforderlich, wenn Sie Ressourcen-Principal-Zugangsdaten aktivieren. Weitere Informationen finden Sie unter Resource Principal für den Zugriff auf Oracle Cloud Infrastructure-Ressourcen verwenden.

  3. Führen Sie DBMS_CLOUD.EXPORT_DATA aus, und geben Sie den format-Parameter type mit dem Wert parquet an, um die Ergebnisse als Parquet-Dateien in den Cloud-Objektspeicher zu exportieren.
    Zum Generieren der Parkettausgabedateien gibt es zwei Optionen für den Parameter file_uri_list:
    • Setzen Sie den Wert file_uri_list auf die URL für einen vorhandenen Bucket in Ihrem Cloud-Objektspeicher.

    • Setzen Sie den Wert file_uri_list auf die URL für einen vorhandenen Bucket in Ihrem Cloud-Objektspeicher, und fügen Sie ein Dateinamenpräfix hinzu, das beim Generieren der Dateinamen für die exportierten Parquet-Dateien verwendet werden soll.

    Wenn Sie das Dateinamenspräfix nicht in die file_uri_list aufnehmen, stellt DBMS_CLOUD.EXPORT_DATA ein Dateinamenpräfix bereit. Weitere Informationen finden Sie unter Dateibenennung für Textausgabe (CSV, JSON, Parquet oder XML).

    Beispiel: Im Folgenden wird DBMS_CLOUD.EXPORT_DATA mit einem Dateinamenpräfix gezeigt, das in file_uri_list angegeben wird:

    BEGIN
      DBMS_CLOUD.EXPORT_DATA(
        credential_name => 'DEF_CRED_NAME',
        file_uri_list   => 'https://objectstorage.us-phoenix-1.oraclecloud.com/n/namespace-string/b/bucketname/o/dept_export',
        query           => 'SELECT * FROM DEPT',
        format          => JSON_OBJECT('type' value 'parquet', 'compression' value 'snappy'));
    END;
    /

    In diesem Beispiel ist namespace-string der Oracle Cloud Infrastructure-Objektspeicher-Namespace und bucketname der Bucket-Name. Weitere Informationen finden Sie unter Object Storage-Namespaces.

    Ausführliche Informationen zu den Parametern finden Sie unter Prozedur EXPORT_DATA.

    Ausführliche Informationen zu den verfügbaren format-Parametern, die Sie mit DBMS_CLOUD.EXPORT_DATA verwenden können, finden Sie unter DBMS_CLOUD-Paketformatoptionen für EXPORT_DATA.

Hinweise zum Export mit DBMS_CLOUD.EXPORT_DATA:

  • Bei dem von Ihnen angegebenen query-Parameter kann es sich bei Bedarf um eine erweiterte Abfrage handeln, z.B. eine Abfrage, die Joins oder Unterabfragen enthält.

  • Geben Sie den Parameter format mit der Option compression an, um die Ausgabedateien zu komprimieren. Der Standardwert für compression für type parquet ist snappy.

  • Wenn Sie die exportierten Dateien nicht mehr benötigen, verwenden Sie die Prozedur DBMS_CLOUD.DELETE_OBJECT, oder löschen Sie die Dateien mit nativen Cloud-Objektspeicherbefehlen.

  • Weitere Informationen zur Zuordnung von Oracle-Typ zu Parquet-Typ finden Sie unter DBMS_CLOUD Package - Oracle Data Type to Parquet Mapping.

    Die folgenden Typen werden nicht unterstützt oder haben Einschränkungen bei der Unterstützung für den Export von Parquet mit DBMS_CLOUD.EXPORT_DATA:

    Oracle-Typ Hinweise

    BFILE

    Nicht unterstützt

    BLOB

    Nicht unterstützt

    DATE

    Wird mit der folgenden Einschränkung unterstützt: Das Format DATE unterstützt nur Datum, Monat und Jahr. Stunde, Minute und Sekunden werden nicht unterstützt.

    Weitere Informationen zu NLS-Formatbeschränkungen für den Export von DATE in Parquet finden Sie unter DBMS_CLOUD Oracle-Datentyp-zu-Parkett-Zuordnung in Packages.

    INTERVAL DAY TO SECOND

    Wird unterstützt und intern als Zeichenfolge behandelt

    INTERVAL YEAR TO MONTH

    Wird unterstützt und intern als Zeichenfolge behandelt

    LONG

    Nicht unterstützt

    LONG RAW

    Nicht unterstützt

    NUMBER

    Wird mit den folgenden Einschränkungen unterstützt:

    • Kann eine maximale Genauigkeit von 38 und eine Skalierung haben, die kleiner als die Genauigkeit ist.
    • Wenn für den Spaltentyp NUMBER keine Nachkommastellen und Nachkommastellen angegeben sind, wird standardmäßig die Nachkommastellen 38 und die Nachkommastellen 20 verwendet.
    • Negative Skalierung wird für NUMBER-Typen nicht unterstützt.

    Object Types

    Nicht unterstützt

    TIMESTAMP

    Wird mit den folgenden Einschränkungen unterstützt:

    • Wenn mehrere Spalten mit unterschiedlicher Genauigkeit vorhanden sind, wird die höchste Genauigkeit verwendet.
    • TIMESTAMP WITH TIME ZONE Der Oracle-Datentyp verwendet nur den Zeitstempel.

    Weitere Informationen zu NLS-Formatbeschränkungen für den Export von TIMESTAMP in Parquet finden Sie unter DBMS_CLOUD Oracle-Datentyp-zu-Parkett-Zuordnung in Packages.