Externe Daten mit Autonomous Database abfragen
Beschreibt Packages und Tools zum Abfragen und Validieren von Daten mit Autonomous Database.
Externe Daten werden nicht von der Datenbank verwaltet. Sie können jedoch DBMS_CLOUD
-Prozeduren verwenden, um externe Daten abzufragen. Obwohl Abfragen für externe Daten nicht so schnell wie Abfragen für Datenbanktabellen sind, können Sie mit diesem Ansatz schnell Abfragen für externe Quelldateien und externe Daten ausführen. Je nach Typ der externen Tabelle können Sie externe Daten mit den Validierungsprozeduren DBMS_CLOUD
validieren. Mit den Datenvalidierungsprozeduren können Sie die Quelldateien für eine externe Tabelle validiert, sodass Sie Probleme erkennen und die Daten in der externen Tabelle korrigieren oder ungültige Daten ausschließen können, bevor Sie die Daten verwenden.
Wenn Sie nicht den
ADMIN
-Benutzer verwenden, stellen Sie sicher, dass der Benutzer über die erforderlichen Berechtigungen für die jeweiligen Vorgänge verfügt. Weitere Informationen finden Sie unter Benutzerberechtigungen in Autonomous Database verwalten - Verbindung mit einem Clienttool herstellen.
- Externe Daten abfragen
Um Daten in Dateien in der Cloud abzufragen, müssen Sie zuerst Ihre Objektspeicherzugangsdaten in Autonomous Database speichern und dann eine externe Tabelle mit der PL/SQL-ProzedurDBMS_CLOUD.CREATE_EXTERNAL_TABLE
erstellen. - Externe Daten mit ORC-, Parquet- oder Avro-Quelldateien abfragen
Autonomous Database erleichtert den Zugriff auf ORC-, Parquet- oder Avro-Daten, die über externe Tabellen im Objektspeicher gespeichert sind. In ORC-, Parquet- und Avro-Quellen sind Metadaten eingebettet, und die ProzedurDBMS_CLOUD.CREATE_EXTERNAL_TABLE
kann diese Metadaten verwenden, um die Erstellung externer Tabellen zu vereinfachen. - Externe Tabellen mit impliziter Partitionierung abfragen
In Autonomous Database können Sie implizite partitionierte externe Tabellen aus partitionierten Daten im Hive-Stil oder aus partitionierten einfachen Ordnern erstellen, die in Ihrem Cloud-Objektspeicher gespeichert sind. - Externe Tabellen mit in Quelldateien angegebener Partitionierung abfragen
Wenn Sie mehrere Datendateien im Objektspeicher als einzelne externe Tabelle abfragen möchten und die Dateien als mehrere logische Partitionen dargestellt werden können, wird dringend empfohlen, eine externe partitionierte Tabelle zu verwenden. Durch die Verwendung einer externen partitionierten Tabelle wird die logische Partitionierung der Datendateien für den Abfragezugriff beibehalten. - Externe partitionierte Daten abfragen (mit Partitionierungsklausel)
Wenn Sie mehrere Datendateien im Objektspeicher als einzelne externe Tabelle abfragen möchten und die Dateien als mehrere logische Partitionen dargestellt werden können, wird dringend empfohlen, eine externe partitionierte Tabelle zu verwenden. Durch die Verwendung einer externen partitionierten Tabelle wird die logische Partitionierung der Datendateien für den Abfragezugriff beibehalten. Verwenden Sie die ProzedurDBMS_CLOUD.CREATE_EXTERNAL_PART_TABLE
, um eine externe partitionierte Tabelle zu erstellen. - Abfragedaten, die eine Tabellen-Hyperlinkquelle verwenden
Sie können eine externe Tabelle über einen Autonomous Database-Tabellen-Hyperlink erstellen. - Hybrid partitionierte Daten abfragen
Wenn Sie interne Daten und mehrere Datendateien im Objektspeicher als einzelne logische Tabelle abfragen möchten, können Sie eine hybride partitionierte Tabelle verwenden, um die Daten als einzelnes Objekt darzustellen. Verwenden Sie die ProzedurDBMS_CLOUD.CREATE_HYBRID_PART_TABLE
, um eine hybride partitionierte Tabelle zu erstellen. - Externe Data Pump-Dumpdateien abfragen
Sie können auch Oracle Data Pump-Dumpdateien in der Cloud abfragen, indem Sie eine externe Tabelle mitDBMS_CLOUD.CREATE_EXTERNAL_TABLE
erstellen. - Big Data Service-Hadoop-(HDFS-)Daten aus Autonomous Database abfragen
Sie können Datenbanklinks zu Oracle Big Data Service aus Autonomous Database erstellen. - Externe Daten mit Data Catalog abfragen
Oracle Cloud Infrastructure Data Catalog ist der Metadatenverwaltungsservice für Oracle Cloud, mit dem Sie Daten ermitteln und Data Governance unterstützen können. Es bietet eine Bestandsaufnahme von Assets, ein Geschäftsglossar und einen gemeinsamen Metastore für Data Lakes. - Externe Daten mit AWS Glue Data Catalog abfragen
Autonomous Database unterstützt ein System zur Synchronisierung mit einer Amazon AWS Glue Data Catalog-Instanz. - Apache Iceberg-Tabellen abfragen
Autonomous Database unterstützt das Abfragen von Apache Iceberg-Tabellen. - Externe Daten validieren
Um eine externe Tabelle zu validieren, können Sie die ProzedurDBMS_CLOUD.VALIDATE_EXTERNAL_TABLE
verwenden. - Externe partitionierte Daten validieren
Um eine externe partitionierte Tabelle zu validieren, können Sie die ProzedurDBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLE
verwenden. Diese Prozedur enthält einen Parameter, mit dem Sie eine bestimmte zu validierende Partition angeben können. - Hybrid partitionierte Daten validieren
Um eine hybride partitionierte Tabelle zu validieren, können Sie die ProzedurDBMS_CLOUD.VALIDATE_HYBRID_PART_TABLE
verwenden. Diese Prozedur enthält einen Parameter, mit dem Sie eine bestimmte zu validierende Partition angeben können. - Logs für Datenvalidierung anzeigen
Um eine externe Tabelle zu validieren, verwenden Sie die ProzedurenDBMS_CLOUD.VALIDATE_EXTERNAL_TABLE
,DBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLE
undDBMS_CLOUD.VALIDATE_HYBRID_PART_TABLE
.
Übergeordnetes Thema: Daten verknüpfen