Externe Daten mit Autonomous Database abfragen
Beschreibt Packages und Tools zum Abfragen und Validieren von Daten mit Autonomous Database.
Externe Daten werden nicht von der Datenbank verwaltet. Sie können jedoch DBMS_CLOUD
-Prozeduren verwenden, um externe Daten abzurufen. Obwohl Abfragen für externe Daten nicht so schnell wie Abfragen für Datenbanktabellen sind, können Sie mit diesem Ansatz schnell Abfragen für externe Quelldateien und externe Daten ausführen. Je nach Typ der externen Tabelle können Sie externe Daten mit den DBMS_CLOUD
-Validierungsprozeduren validieren. Mit den Datenvalidierungsprozeduren können Sie die Quelldateien für eine externe Tabelle validieren, sodass Sie Probleme erkennen und die Daten in der externen Tabelle korrigieren oder ungültige Daten ausschließen können, bevor Sie die Daten verwenden.
Wenn Sie nicht den
ADMIN
-Benutzer verwenden, stellen Sie sicher, dass der Benutzer über die erforderlichen Berechtigungen für die jeweiligen Vorgänge verfügt. Weitere Informationen finden Sie unter Benutzerberechtigungen auf Autonomous Database verwalten - Verbindung mit Clienttool herstellen.
- Externe Daten abfragen
Um Daten in Dateien in der Cloud abzufragen, müssen Sie zuerst die Objektspeicherzugangsdaten in Autonomous Database speichern und dann eine externe Tabelle mit der PL/SQL-ProzedurDBMS_CLOUD.CREATE_EXTERNAL_TABLE
erstellen. - Externe Daten mit ORC-, Parquet- oder Avro-Quelldateien abfragen
Autonomous Database erleichtert den Zugriff auf ORC-, Parquet- oder Avro-Daten, die im Objektspeicher mit externen Tabellen gespeichert sind. In ORC-, Parquet- und Avro-Quellen sind Metadaten eingebettet, die von der ProzedurDBMS_CLOUD.CREATE_EXTERNAL_TABLE
verwendet werden können, um das Erstellen externer Tabellen zu vereinfachen. - Externe Tabellen mit impliziter Partitionierung abfragen
In Autonomous Database können Sie implizite partitionierte externe Tabellen aus im Hive-Stil partitionierten Daten oder aus im einfachen Ordner partitionierten Daten in Ihrem Cloud-Objektspeicher erstellen. - Externe Tabellen mit Partitionierung abfragen, die in Quelldateien angegeben ist
Wenn Sie mehrere Datendateien im Objektspeicher als einzelne externe Tabelle abfragen möchten und die Dateien als mehrere logische Partitionen dargestellt werden können, wird dringend empfohlen, eine externe partitionierte Tabelle zu verwenden. Bei Verwendung einer externen partitionierten Tabelle wird die logische Partitionierung Ihrer Datendateien für den Abfragezugriff beibehalten. - Externe partitionierte Daten abfragen (mit Partitionierungsklausel)
Wenn Sie mehrere Datendateien im Objektspeicher als einzelne externe Tabelle abfragen möchten und die Dateien als mehrere logische Partitionen dargestellt werden können, wird dringend empfohlen, eine externe partitionierte Tabelle zu verwenden. Bei Verwendung einer externen partitionierten Tabelle wird die logische Partitionierung Ihrer Datendateien für den Abfragezugriff beibehalten. Verwenden Sie die ProzedurDBMS_CLOUD.CREATE_EXTERNAL_PART_TABLE
, um eine externe partitionierte Tabelle zu erstellen. - Abfragedaten, die eine Tabellen-Hyperlinkquelle verwenden
Sie können eine externe Tabelle über einen Autonomous Database-Tabellen-Hyperlink erstellen. - Hybrid-partitionierte Daten abfragen
Wenn Sie interne Daten und mehrere Datendateien im Objektspeicher als eine logische Tabelle abfragen möchten, können Sie die Daten mit einer Hybridpartitionierungstabelle als ein Objekt darstellen. Verwenden Sie die ProzedurDBMS_CLOUD.CREATE_HYBRID_PART_TABLE
, um eine Hybrid-partitionierte Tabelle zu erstellen. - Externe Data Pump-Dumpdateien abfragen
Sie können auch Oracle Data Pump-Dumpdateien in der Cloud abfragen, indem Sie mitDBMS_CLOUD.CREATE_EXTERNAL_TABLE
eine externe Tabelle erstellen. - Big Data Service-Hadoop-(HDFS-)Daten aus Autonomous Database abrufen
Sie können Datenbanklinks von Autonomous Database aus zu Oracle Big Data Service erstellen. - Externe Daten mit Data Catalog abfragen
Oracle Cloud Infrastructure Data Catalog ist der Metadatenmanagementservice für Oracle Cloud, mit dem Sie Daten finden und Data Governance unterstützen können. Er bietet einen Bestand an Assets, ein Geschäftsglossar und einen gemeinsamen Metastore für Data Lakes. - Externe Daten mit AWS Glue Data Catalog abfragen
Autonomous Database unterstützt ein System für die Synchronisierung mit einer Amazon AWS Glue Data Catalog-Instanz. - Apache Iceberg-Tabellen abfragen
Autonomous Database unterstützt das Abfragen von Apache Iceberg-Tabellen. - Externe Daten validieren
Um eine externe Tabelle zu validieren, können Sie die ProzedurDBMS_CLOUD.VALIDATE_EXTERNAL_TABLE
verwenden. - Externe partitionierte Daten validieren
Um eine externe partitionierte Tabelle zu validieren, können Sie die ProzedurDBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLE
verwenden. Diese Prozedur enthält einen Parameter, mit dem Sie eine bestimmte zu validierende Partition angeben können. - Hybridpartitionierte Daten validieren
Um eine Hybridpartitionierungstabelle zu validieren, können Sie das VerfahrenDBMS_CLOUD.VALIDATE_HYBRID_PART_TABLE
verwenden. Diese Prozedur enthält einen Parameter, mit dem Sie eine bestimmte zu validierende Partition angeben können. - Logs für Datenvalidierung anzeigen
Um eine externe Tabelle zu validieren, verwenden Sie die ProzedurenDBMS_CLOUD.VALIDATE_EXTERNAL_TABLE
,DBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLE
undDBMS_CLOUD.VALIDATE_HYBRID_PART_TABLE
.
Übergeordnetes Thema: Daten verknüpfen