Daten als Parquet in ein Verzeichnis exportieren

Zeigt die Schritte zum Exportieren von Tabellendaten aus Autonomous Database in ein Verzeichnis als Parquet-Daten durch Angabe einer Abfrage an.

  1. Melden Sie sich bei Ihrer Autonomous Database-Instanz an.

    Weitere Informationen finden Sie unter Verbindung zu Autonomous Database herstellen.

  2. Verzeichnis erstellen.

    Beispiele:

    CREATE DIRECTORY export_dir AS 'export_dir';
    Weitere Informationen finden Sie unter Verzeichnis in Autonomous Database erstellen.
  3. Führen Sie DBMS_CLOUD.EXPORT_DATA aus, und geben Sie den Parameter format type mit dem Wert json an, um die Ergebnisse als Parquet-Dateien in ein Verzeichnis zu exportieren. Nehmen Sie den Parameter credential nicht auf, wenn Sie die Ausgabe an ein Verzeichnis senden.
    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => 'export_dir:sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Beim Verzeichnisnamen muss die Groß-/Kleinschreibung beachtet werden, wenn der Verzeichnisname in doppelte Anführungszeichen gesetzt wird. Beispiele:

    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => '"export_dir":sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Ausführliche Informationen zu den Parametern finden Sie unter Prozedur EXPORT_DATA.

    Ausführliche Informationen zu den verfügbaren format-Parametern, die Sie mit DBMS_CLOUD.EXPORT_DATA verwenden können, finden Sie unter DBMS_CLOUD-Paketformatoptionen für EXPORT_DATA.

    Parameter:

    • file_uri_list: ist eine kommagetrennte Liste der Exportdateien. Die Verwendung von Platzhalter- und Ersetzungszeichen wird in file_uri_list nicht unterstützt.

    • format: Gibt den erforderlichen type-Parameter an. Die gültigen Werte sind datapump, json, xml, csv und parquet. Außerdem werden optional die Optionen definiert, die Sie für den Export mit dem ORACLE_DATAPUMP-Zugriffstreiber angeben können.

    • query: Gibt eine SELECT-Anweisung an, sodass nur die erforderlichen Daten exportiert werden. Die Abfrage bestimmt den Inhalt der Dumpdatei(en.

    Ausführliche Informationen zu den Parametern finden Sie unter Prozedur EXPORT_DATA.

Hinweise zum Export mit DBMS_CLOUD.EXPORT_DATA:

  • Bei dem von Ihnen angegebenen query-Parameter kann es sich bei Bedarf um eine erweiterte Abfrage handeln, z.B. eine Abfrage, die Joins oder Unterabfragen enthält.

  • Geben Sie den Parameter format mit der Option compression an, um die Ausgabedateien zu komprimieren.

  • Weitere Informationen zur Zuordnung von Oracle-Typ zu Parquet-Typ finden Sie unter DBMS_CLOUD Package - Oracle Data Type to Parquet Mapping.

    Die folgenden Typen werden nicht unterstützt oder haben Einschränkungen bei der Unterstützung für den Export von Parquet mit DBMS_CLOUD.EXPORT_DATA:

    Oracle-Typ Hinweise

    BFILE

    Nicht unterstützt

    BLOB

    Nicht unterstützt

    DATE

    Wird mit der folgenden Einschränkung unterstützt: Das Format DATE unterstützt nur Datum, Monat und Jahr. Stunde, Minute und Sekunden werden nicht unterstützt.

    Weitere Informationen zu NLS-Formatbeschränkungen für den Export von DATE in Parquet finden Sie unter DBMS_CLOUD Oracle-Datentyp-zu-Parkett-Zuordnung in Packages.

    INTERVAL DAY TO SECOND

    Wird unterstützt und intern als Zeichenfolge behandelt

    INTERVAL YEAR TO MONTH

    Wird unterstützt und intern als Zeichenfolge behandelt

    LONG

    Nicht unterstützt

    LONG RAW

    Nicht unterstützt

    NUMBER

    Wird mit den folgenden Einschränkungen unterstützt:

    • Kann eine maximale Genauigkeit von 38 und eine Skalierung haben, die kleiner als die Genauigkeit ist.
    • Wenn für den Spaltentyp NUMBER keine Nachkommastellen und Nachkommastellen angegeben sind, wird standardmäßig die Nachkommastellen 38 und die Nachkommastellen 20 verwendet.
    • Negative Skalierung wird für NUMBER-Typen nicht unterstützt.

    Object Types

    Nicht unterstützt

    TIMESTAMP

    Wird mit den folgenden Einschränkungen unterstützt:

    • Wenn mehrere Spalten mit unterschiedlicher Genauigkeit vorhanden sind, wird die höchste Genauigkeit verwendet.
    • TIMESTAMP WITH TIME ZONE Der Oracle-Datentyp verwendet nur den Zeitstempel.

    Weitere Informationen zu NLS-Formatbeschränkungen für den Export von TIMESTAMP in Parquet finden Sie unter DBMS_CLOUD Oracle-Datentyp-zu-Parkett-Zuordnung in Packages.