Daten als Parquet in ein Verzeichnis exportieren

Zeigt die Schritte zum Exportieren von Tabellendaten aus Autonomous Database in ein Verzeichnis als Parquet-Daten durch Angabe einer Abfrage an.

  1. Verbinden Sie sich mit Ihrer Autonomous Database-Instanz.

    Weitere Informationen finden Sie unter Verbindung zu Autonomous Database herstellen.

  2. Verzeichnis erstellen.

    Beispiel:

    CREATE DIRECTORY export_dir AS 'export_dir';
    Weitere Informationen finden Sie unter Directory in Autonomous Database erstellen.
  3. Führen Sie DBMS_CLOUD.EXPORT_DATA aus, und geben Sie den Parameter format type mit dem Wert json an, um die Ergebnisse als Parquet-Dateien in ein Verzeichnis zu exportieren. Nehmen Sie den Parameter credential nicht auf, wenn Sie eine Ausgabe an ein Verzeichnis senden.
    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => 'export_dir:sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Beim Verzeichnisnamen muss die Groß-/Kleinschreibung beachtet werden, wenn der Verzeichnisname in doppelte Anführungszeichen gesetzt wird. Beispiel:

    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => '"export_dir":sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Ausführliche Informationen zu den Parametern finden Sie unter Prozedur EXPORT_DATA.

    Ausführliche Informationen zu den verfügbaren format-Parametern, die Sie mit DBMS_CLOUD.EXPORT_DATA verwenden können, finden Sie unter DBMS_CLOUD Package Format Options for EXPORT_DATA.

    Die Parameter sind:

    • file_uri_list: ist eine durch Komma getrennte Liste der Exportdateien. Die Verwendung von Platzhaltern und Ersetzungszeichen wird in file_uri_list nicht unterstützt.

    • format: Gibt den erforderlichen Parameter type an. Die gültigen Werte sind datapump, json, xml, csv und parquet. Außerdem werden optional die Optionen definiert, die Sie für den Export mit dem Zugriffstreiber ORACLE_DATAPUMP angeben können.

    • query: Gibt eine SELECT-Anweisung an, sodass nur die erforderlichen Daten exportiert werden. Die Abfrage bestimmt den Inhalt der Dumpdatei(en).

    Ausführliche Informationen zu den Parametern finden Sie unter Prozedur EXPORT_DATA.

Hinweise zum Exportieren mit DBMS_CLOUD.EXPORT_DATA:

  • Der von Ihnen angegebene Parameter query kann bei Bedarf eine erweiterte Abfrage sein, z.B. eine Abfrage, die Joins oder Unterabfragen enthält.

  • Geben Sie den Parameter format mit der Option compression an, um die Ausgabedateien zu komprimieren.

  • Weitere Informationen zur Zuordnung von Oracle-Typ zu Parquet-Typ finden Sie unter DBMS_CLOUD Oracle-Datentyp zu Parquet-Typ verpacken.

    Die folgenden Typen werden nicht unterstützt oder haben Einschränkungen bei der Unterstützung für den Export von Parquet mit DBMS_CLOUD.EXPORT_DATA:

    Oracle-spezifischer Typ Notizen

    BFILE

    Wird nicht unterstützt

    BLOB

    Wird nicht unterstützt

    DATE

    Unterstützt mit der folgenden Einschränkung: Das DATE-Format unterstützt nur Datum, Monat und Jahr. Stunde, Minute und Sekunden werden nicht unterstützt.

    Weitere Informationen zu den NLS-Formatbeschränkungen für den Export von DATE in Parquet finden Sie unter DBMS_CLOUD Oracle-Datentyp-/Parquet-Mapping verpacken.

    INTERVAL DAY TO SECOND

    Wird intern unterstützt und als Zeichenfolge behandelt

    INTERVAL YEAR TO MONTH

    Wird intern unterstützt und als Zeichenfolge behandelt

    LONG

    Wird nicht unterstützt

    LONG RAW

    Wird nicht unterstützt

    NUMBER

    Unterstützt mit den folgenden Einschränkungen:

    • Kann eine maximale Genauigkeit von 38 und eine Skala kleiner als die Präzision haben.
    • Wenn für den Spaltentyp NUMBER keine Genauigkeit und keine Skalierung angegeben ist, wird standardmäßig die Gesamtstellenzahl 38 und die Skalierung 20 verwendet.
    • Negative Skalierung wird für NUMBER-Typen nicht unterstützt.

    Object Types

    Wird nicht unterstützt

    TIMESTAMP

    Unterstützt mit den folgenden Einschränkungen:

    • Wenn mehrere Spalten mit unterschiedlicher Genauigkeit vorhanden sind, wird die höchste Genauigkeit verwendet.
    • TIMESTAMP WITH TIME ZONE Der Oracle-Datentyp verwendet nur den Zeitstempel.

    Weitere Informationen zu den NLS-Formatbeschränkungen für den Export von TIMESTAMP in Parquet finden Sie unter DBMS_CLOUD Oracle-Datentyp-/Parquet-Mapping verpacken.