DBMS_DCAT-Package
Das Package DBMS_DCAT
bietet Funktionen und Prozeduren, mit denen Autonomous Database-Benutzer das Daten-Discovery- und zentralisierte Metadatenmanagementsystem von OCI Data Catalog nutzen können.
Data Catalog sammelt Metadaten aus den Objektspeicherassets eines Data Lakes. Beim Harvesting-Prozess werden logische Entitys erstellt, die als Tabellen mit Spalten und zugehörigen Datentypen betrachtet werden können. DBMS_DCAT
-Prozeduren und -Funktionen verbinden Autonomous Database mit Data Catalog, synchronisieren die Assets mit der Datenbank und erstellen geschützte Schemas und externe Tabellen. Anschließend können Sie den Objektspeicher mit diesen externen Tabellen abfragen und ganz einfach externe Daten mit in Autonomous Database gespeicherten Daten verknüpfen. Dies vereinfacht den Managementprozess erheblich. Es gibt einen einzigen, zentral verwalteten Metadatenspeicher, der über mehrere OCI-Services (einschließlich autonomer Datenbanken) hinweg gemeinsam genutzt wird. Außerdem gibt es Autonomous Database Dictionary Views, mit denen Sie den Inhalt von Data Catalog mit SQL prüfen und anzeigen können, wie diese Data Catalog-Entitys Ihren Autonomous Database-Schemas und -Tabellen zugeordnet werden.
- Data Catalog-Benutzer und -Rollen
DasDBMS_DCAT
-Package unterstützt synchronisierte Benutzer/Schemas,dcat_admin
-Benutzer und lokale Benutzer. Benutzer müssen über die Rolledcat_sync
verfügen, um dieses Package verwenden zu können. - Erforderliche Zugangsdaten und IAM-Policys
In diesem Thema werden die Oracle Cloud Infrastructure Identity and Access Management-(IAM-)Benutzerzugangsdaten und -Policys beschrieben, die erforderlich sind, um Autonomous Database-Benutzern die Berechtigung zum Verwalten eines Datenkatalogs und zum Lesen aus dem Objektspeicher zu erteilen. - Zusammenfassung der Connection Management-Unterprogramme
In dieser Tabelle werden dieDBMS_DCAT
-Packageprozeduren aufgeführt, mit denen Data Catalog-Verbindungen erstellt, abgefragt und gelöscht werden. - Zusammenfassung der Synchronisierungsunterprogramme
Mit den in dieser Tabelle aufgeführten Verfahren können Sie eine Synchronisierung ausführen, einen Synchronisierungsjob erstellen und löschen sowie synchronisierte Schemas löschen. - Zusammenfassung der Data Catalog-Ansichten
Die Data Catalog-Integration mit Autonomous Database bietet zahlreiche Tabellen und Ansichten.
Übergeordnetes Thema: Von Autonomous Database bereitgestellte Packages - Referenz
Data Catalog-Benutzer und -Rollen
Das DBMS_DCAT
-Package unterstützt synchronisierte Benutzer/Schemas, dcat_admin
-Benutzer und lokale Benutzer. Benutzer müssen über die Rolle dcat_sync
verfügen, um dieses Package verwenden zu können.
Data Catalog-Benutzer
- Synchronisierte Benutzer/Schemas
Die synchronisierten externen Tabellen sind in Datenbankschemas unterteilt, die Datenasset-/Bucket-Kombinationen entsprechen, oder nach benutzerdefinierten Eigenschaften, die vom Benutzer festgelegt wurden. Die synchronisierten Schemas werden bei der Data Catalog-Synchronisierung automatisch erstellt/gelöscht. Sie werden ohne die Berechtigung CREATE SESSION als keine Authentifizierungsbenutzer erstellt. Die synchronisierten Schemas werden auch mit der geschützten Klausel erstellt, sodass sie nicht von lokalen Benutzern (nicht einmal dem PDB-Admin) geändert werden können und nur über die Synchronisierung geändert werden können.
- Benutzer
dcat_admin
Der Benutzer
dcat_admin
ist ein lokaler Datenbankbenutzer, der eine Synchronisierung ausführen und anderen Benutzern oder Rollen READ-Berechtigungen für synchronisierte Tabellen erteilen kann. Der Benutzer wird ohne die Berechtigung CREATE SESSION als Benutzer ohne Authentifizierung erstellt. - Lokale Benutzer
Datenbankbenutzern, die externe Tabellen abfragen, müssen von den Benutzern
dcat_admin
oder ADMIN explizit READ-Berechtigungen für die synchronisierten externen Tabellen erteilt werden. Nach Abschluss der Synchronisierung haben standardmäßig nur die Benutzerdcat_admin
und ADMIN Zugriff auf die synchronisierten externen Tabellen.
Datenkatalogrollen
dcat_sync
Die Rolle
dcat_sync
verfügt über alle erforderlichen Berechtigungen für die Verwendung des PackagesDBMS_DCAT
. Benutzer müssen über diese Rolle verfügen, um die API zum Navigieren im Datenkatalog und zum Ausführen der Synchronisierung verwenden zu können.
Übergeordnetes Thema: DBMS_DCAT Package
Erforderliche Zugangsdaten und IAM-Policys
In diesem Thema werden die Oracle Cloud Infrastructure Identity and Access Management-(IAM-)Benutzerzugangsdaten und -Policys beschrieben, die erforderlich sind, um Autonomous Database-Benutzern die Berechtigung zum Verwalten eines Datenkatalogs und zum Lesen aus dem Objektspeicher zu erteilen.
OCI Data Catalog-Zugangsdaten und -Policy-Anforderungen:
- Ein Zugangsdatenobjekt mit der Berechtigung zum Verwalten einer Data Catalog-Instanz ist erforderlich. Zugangsdatenobjekte mit nativer OCI-Authentifizierung oder Zugangsdaten für Resource Principals werden unterstützt. Zugangsdatenobjekte, die auf Authentifizierungstoken-Benutzer-Principals basieren, werden nicht unterstützt.
Informationen zum Verwalten von Zugangsdaten finden Sie unter DBMS_CLOUD for Access Management.
Beispiele für native OCI-Authentifizierung finden Sie unter Beispiel: OCI Native Authentication Credential Object erstellen und Autonomous Database unterstützt jetzt den Zugriff auf den Object Storage mit nativer OCI-Authentifizierung.
Beispiele zur Verwendung des Resource Principals finden Sie unter Beispiel: Autonomous Database Resource Principal verwenden und Oracle Cloud Infrastructure-Ressourcen von Ihrer Autonomous Database mit Resource Principal aufrufen.
-
Die Berechtigung "Datenkatalog verwalten" ist erforderlich, damit Autonomous Database dem Data Catalog-Namespace benutzerdefinierte Eigenschaften hinzufügen kann. Mit diesen Berechtigungen können Sie Schemanamen, Tabellennamen, Spaltennamen und mehr außer Kraft setzen.
Weitere Informationen zu Data Catalog-Berechtigungen finden Sie unter Für jeden API-Vorgang erforderliche Berechtigungen.
-
Die Berechtigung "Objektspeicher lesen" für Buckets ist erforderlich, damit Autonomous Database Datendateien abfragen kann.
Weitere Beispiele für Oracle Object Storage-Policys finden Sie unter Policy-Beispiele.
Zugangsdaten und Richtlinienanforderungen für AWS Glue Data Catalog
- Ein Berechtigungsnachweisobjekt mit der Berechtigung für den Zugriff auf einen AWS Glue Data Catalog ist erforderlich. Informationen zum Verwalten von Zugangsdaten finden Sie unter DBMS_CLOUD for Access Management.
Für den Zugriff auf einen AWS Glue Data Catalog sind die folgenden Berechtigungen erforderlich: kleben: GetDatabases , kleben: GetTables und kleben: GetTable.
Darüber hinaus ist die Berechtigung s3:GetBucketLocation während der Synchronisierung erforderlich, um auflösbare HTTPS-URLs zu generieren, die auf die zugrunde liegenden S3-Objekte verweisen. - Ein Zugangsdatenobjekt mit der Berechtigung für den Zugriff auf die in S3 gespeicherten Dateien ist erforderlich, damit Autonomous Database Datendateien abfragen kann.
- AWS-Zugangsdaten werden unterstützt. AWS Amazon Resource Names-(ARN-)Zugangsdaten werden nicht unterstützt.
Beispiel: OCI-natives Authentifizierungszugangsdatenobjekt erstellen
In diesem Beispiel erstellen wir native OCI-Authentifizierungszugangsdaten, die beim Erstellen eines Datenkatalogs oder eines Objektspeicher-Zugangsdatenobjekts verwendet werden können. Weitere Einzelheiten finden Sie unter Prozedur DBMS_DCAT SET_DATA_CATALOG_CREDENTIAL und Prozedur DBMS_DCAT SET_OBJECT_STORE_CREDENTIAL.
Bei der nativen OCI-Authentifizierung enthält die Prozedur DBMS_CLOUD.CREATE_CREDENTIAL
die folgenden Parameter: credential_name
, user_ocid
, tenancy_ocid
, private_key
und fingerprint
. Eine vollständige Beschreibung dieser Prozedur finden Sie unter Prozedur DBMS_CLOUD CREATE_CREDENTIAL.
credential_name
ist der Name des Zugangsdatenobjekts. Die Parameter user_ocid
und tenancy_ocid
entsprechen den OCIDs des Benutzers bzw. Mandanten.
Der Parameter private_key
gibt den generierten Private Key im PEM-Format an. Private Keys, die mit einer Passphrase erstellt wurden, werden nicht unterstützt. Daher müssen wir sicherstellen, dass wir einen Schlüssel ohne Passphrase generieren. Weitere Informationen zum Erstellen eines Private Keys ohne Passphrase finden Sie unter How to Generate an API Signing Key. Außerdem darf der PRIVATE KEY, den wir für diesen Parameter bereitstellen, nur den Schlüssel selbst ohne Header oder Footer enthalten (z.B. '-----BEGIN RSA PRIVATE KEY-----', '-----END RSA PRIVATE KEY-----').
Der Parameter fingerprint
gibt den Fingerprint an, der entweder nach dem Hochladen des Public Keys in die Konsole oder mit den OpenSSL-Befehlen abgerufen wird. Weitere Informationen zum Abrufen des Fingerprints finden Sie unter So laden Sie den Public Key hoch und So rufen Sie den Fingerprint des Schlüssels ab.
Nachdem alle erforderlichen Informationen erfasst und der Private Key generiert wurde, können Sie die folgende CREATE_CREDENTIAL
-Prozedur ausführen:
BEGIN
DBMS_CLOUD.CREATE_CREDENTIAL (
credential_name => 'OCI_NATIVE_CRED',
user_ocid => 'ocid1.user.oc1..aaaaaaaatfn77fe3fxux3o5lego7glqjejrzjsqsrs64f4jsjrhbsk5qzndq',
tenancy_ocid => 'ocid1.tenancy.oc1..aaaaaaaapwkfqz3upqklvmelbm3j77nn3y7uqmlsod75rea5zmtmbl574ve6a',
private_key => 'MIIEogIBAAKCAQEA...t9SH7Zx7a5iV7QZJS5WeFLMUEv+YbYAjnXK+dOnPQtkhOblQwCEY3Hsblj7Xz7o=',
fingerprint => '4f:0c:d6:b7:f2:43:3c:08:df:62:e3:b2:27:2e:3c:7a');
END;
/
dba_credentials
angezeigt:SELECT owner, credential_name
FROM dba_credentials
WHERE credential_name LIKE '%NATIVE%';
OWNER CREDENTIAL_NAME
----- ---------------
ADMIN OCI_NATIVE_CRED
Beispiel: Autonomous Database-Resource Principal verwenden
In diesem Beispiel wird eine dynamische Gruppe erstellt, die entsprechende Ressourcenmitglieder enthält. Die dynamische Gruppe erhält die Berechtigung zum Verwalten eines Datenkatalogs, und die dynamische Gruppe erhält dann die Berechtigung zum Lesen aus dem Objektspeicher.
-
Erstellen Sie eine dynamische Gruppe namens
adb-grp-1
. Fügen Sie eine Vergleichsregel zuadb-grp-1
hinzu, die die Autonomous Database-Instanz mit OCIDocid1.autonomousdatabase.oc1.iad.abuwcljr...fjkfe
als Ressourcenmitglied enthält.Vergleichsregel für dynamische Gruppe:
resource.id = 'ocid1.autonomousdatabase.oc1.iad.abuwcljr...fjkfe'
-
Definieren Sie eine Policy, die der dynamischen Gruppe
adb-grp-1
vollständigen Zugriff auf die Data Catalog-Instanzen im Compartmentmycompartment
erteilt.allow dynamic-group adb-grp-1 to manage data-catalog-family in compartment mycompartment
-
Definieren Sie eine Policy, mit der die dynamische Gruppe
adb-grp-1
einen beliebigen Bucket im Compartmentmycompartment
lesen kann.allow dynamic-group adb-grp-1 to read objects in compartment mycompartment
Beispiel: Verwenden von Benutzer-Principals
In diesem Beispiel ist user1
ein Mitglied der Gruppe adb-admins
. Alle Mitglieder dieser Gruppe erhalten die Berechtigung, alle Datenkataloge in mycompartment
zu verwalten und aus dem Objektspeicher in mycompartment
zu lesen.
- Ermöglichen Sie Benutzern, die Mitglieder von
adb-admins
sind, die Verwaltung aller Datenkataloge inmycompartment
.allow group adb-admins to manage data-catalog-family in compartment mycompartment
- Ermöglichen Sie Benutzern, die Mitglieder von
adb-admins
sind, das Lesen aller Objekte in einem beliebigen Bucket inmycompartment
.allow group adb-admins to read objects in compartment mycompartment
Übergeordnetes Thema: DBMS_DCAT Package
Zusammenfassung von Connection Management-Unterprogrammen
In dieser Tabelle werden die DBMS_DCAT
-Packageprozeduren aufgeführt, mit denen Data Catalog-Verbindungen erstellt, abgefragt und gelöscht werden.
Unterprogramm | Beschreibung |
---|---|
Prozedur SET_DATA_CATALOG_CONN | Verbindung zum angegebenen Datenkatalog erstellen |
Prozedur SET_DATA_CATALOG_CREDENTIAL | Zugangsdaten für den Datenkatalogzugriff festlegen, die von einer bestimmten Verbindung zum Datenkatalog verwendet werden |
Prozedur SET_OBJECT_STORE_CREDENTIAL | Zugangsdaten festlegen, die von der angegebenen eindeutigen Verbindungs-ID für den Zugriff auf den Objektspeicher verwendet werden |
Prozedur UNSET_DATA_CATALOG_CONN | Vorhandene Data Catalog-Verbindung entfernen |
- SET_DATA_CATALOG_CREDENTIAL-Prozedur
Diese Prozedur legt die Zugangsdaten für den Data Catalog-Zugriff fest, die von einer bestimmten Verbindung zum Data Catalog verwendet werden. - Prozedur SET_OBJECT_STORE_CREDENTIAL
Diese Prozedur legt die Zugangsdaten fest, die von der angegebenen eindeutigen Verbindungs-ID für den Zugriff auf den Objektspeicher verwendet werden. Wenn Sie die Zugriffszugangsdaten für den Objektspeicher ändern, werden alle vorhandenen synchronisierten Tabellen geändert, um die neuen Zugangsdaten zu verwenden. - Prozedur SET_DATA_CATALOG_CONN
Diese Prozedur erstellt eine Verbindung zu dem angegebenen Data Catalog. Die Verbindung ist erforderlich, um Metadaten mit Data Catalog zu synchronisieren. Eine Autonomous Database-Instanz kann eine Verbindung zu mehreren Data Catalog-Instanzen herstellen und unterstützt die Verbindung zu OCI Data Catalogs und AWS Glue Data Catalogs. - Prozedur UNSET_DATA_CATALOG_CONN
Mit dieser Prozedur wird eine vorhandene Data Catalog-Verbindung entfernt.
Übergeordnetes Thema: DBMS_DCAT Package
Prozedur SET_DATA_CATALOG_CREDENTIAL
Mit dieser Prozedur werden die Zugangsdaten für den Data Catalog-Zugriff festgelegt, die von einer bestimmten Verbindung zum Data Catalog verwendet werden.
Syntax
PROCEDURE DBMS_DCAT.SET_DATA_CATALOG_CREDENTIAL(
credential_name VARCHAR2(128) DEFAULT NULL,
dcat_con_id VARCHAR2 DEFAULT NULL
);
Parameter
Parameter | Beschreibung |
---|---|
|
(Optional) Die Zugangsdaten für den Zugriff auf den Datenkatalog. |
dcat_con_id |
Die eindeutige Data Catalog-Verbindungs-ID. Diese Zugangsdaten werden für die Verbindung verwendet, die mit dcat_con_id identifiziert wird. Die Standardeinstellung ist Null.
|
Verwendung
Diese Zugangsdaten müssen über die Berechtigung "Datenkatalog verwalten" verfügen. Siehe Data Catalog-Policys. Der Standardwert ist der Resource Principal. Informationen hierzu finden Sie unter Auf Cloud-Ressourcen durch Konfigurieren von Policys und Rollen zugreifen.
Übergeordnetes Thema: Zusammenfassung der Unterprogramme zur Verbindungsverwaltung
Prozedur SET_OBJECT_STORE_CREDENTIAL
Diese Prozedur legt die Zugangsdaten fest, die von der angegebenen eindeutigen Verbindungs-ID für den Zugriff auf den Objektspeicher verwendet werden. Wenn Sie die Zugriffszugangsdaten für den Objektspeicher ändern, werden alle vorhandenen synchronisierten Tabellen geändert, um die neuen Zugangsdaten zu verwenden.
Syntax
PROCEDURE DBMS_DCAT.SET_OBJECT_STORE_CREDENTIAL(
credential_name VARCHAR2(128),
dcat_con_id IN VARCHAR2 DEFAULT NULL
);
Parameter
Parameter | Beschreibung |
---|---|
|
Die Zugangsdaten, die von externen Tabellen für den Zugriff auf den Objektspeicher verwendet werden. |
dcat_con_id |
Die eindeutige Data Catalog-Verbindungs-ID. Der Standardwert ist NULL. |
Übergeordnetes Thema: Zusammenfassung der Unterprogramme zur Verbindungsverwaltung
Prozedur SET_DATA_CATALOG_CONN
Mit dieser Prozedur wird eine Verbindung zum angegebenen Data Catalog hergestellt. Die Verbindung ist erforderlich, um Metadaten mit Data Catalog zu synchronisieren. Eine Autonomous Database-Instanz kann eine Verbindung zu mehreren Data Catalog-Instanzen herstellen und unterstützt die Verbindung zu OCI Data Catalogs und AWS Glue Data Catalogs.
Syntax
PROCEDURE DBMS_DCAT.SET_DATA_CATALOG_CONN (
region VARCHAR2 DEFAULT NULL,
endpoint VARCHAR2 DEFAULT NULL,
catalog_id VARCHAR2 DEFAULT NULL,
dcat_con_id VARCHAR2 DEFAULT NULL,
catalog_type VARCHAR2 DEFAULT NULL
);
Parameter
Parameter | Beschreibung |
---|---|
|
Der Bereich "Data Catalog". Wenn |
|
Der Data Catalog-Endpunkt. Wenn |
|
Die eindeutige Oracle Cloud-ID (OCID) für die Data Catalog-Instanz. Beim Herstellen einer Verbindung zu AWS Glue Data Catalogs ist |
dcat_con_id |
Eine eindeutige Data Catalog-Verbindungs-ID. Diese ID ist beim Herstellen einer Verbindung zu mehreren Datenkatalogen erforderlich und bei nur einer Verbindung optional. Wird verwendet, um die Data Catalog-Verbindung bei nachfolgenden Aufrufen oder beim Abfragen von Ansichten zu referenzieren. Wenn kein Bezeichner angegeben ist, generiert diese Prozedur einen NULL-Verbindungsbezeichner. Für dcat_con_id gelten folgende Einschränkungen:
|
catalog_type |
Der Typ des zu verbindenden Datenkatalogs. Zulässige Werte
|
Verwendung
Sie müssen diese Prozedur nur einmal aufrufen, um die Verbindung festzulegen. Im Rahmen des Verbindungsprozesses fügt Autonomous Database dem Datenkatalog benutzerdefinierte Eigenschaften hinzu. Auf diese benutzerdefinierten Eigenschaften können Data Catalog-Benutzer zugreifen und Standardnamen (für Schemas, Tabellen und Spalten) und Spaltendatentypen außer Kraft setzen.
Vor dem Erstellen einer Verbindung müssen Zugangsdaten erstellt und festgelegt werden. Eine Beschreibung des Verbindungsprozesses finden Sie unter Typischer Workflow mit Data Catalog für OCI Data Catalogs und Benutzerworkflow für die Abfrage mit AWS Glue Data Catalog für AWS Glue Data Catalogs.
Beispiel: Verbindung mit einer bekannten OCID herstellen
In diesem Beispiel stellt Autonomous Database eine Verbindung zu Data Catalog in der Region uk-london-1
her. Der Parameter catalog_id
verwendet die Oracle Cloud-ID (ocid
) für die Data Catalog-Instanz. Der Typ des Datenkatalogs wird automatisch bestimmt: AWS Glue Data Catalog oder OCI Data Catalog.
BEGIN
DBMS_DCAT.SET_DATA_CATALOG_CONN(
region=>'uk-london-1',
catalog_id=>'ocid1.datacatalog.oc1.uk-london-1...');
END;
/
Beispiel: Verbindung zu einem AWS Glue Data Catalog herstellen
Eine Verbindung ist die Verknüpfung zwischen einer Autonomous Database-Instanz und einem AWS Glue Data Catalog. Nach einer erfolgreichen Verbindung kann die Autonomous Database-Instanz mit AWS Glue synchronisiert werden. Jeder AWS-Account verfügt über einen AWS Glue Data Catalog pro Region, und jeder Katalog kann über den entsprechenden Serviceendpunkt für jede Region aufgerufen werden. Eine Autonomous Database-Instanz kann mit einem AWS Glue Data Catalog verknüpft werden, indem die API DBMS_DCAT.SET_DATA_CATALOG_CONN
aufgerufen und der Endpunkt für die Region angegeben wird, in der sich der Katalog befindet.
Siehe AWS Glue-Endpunkte und -Quotas.
In diesem Beispiel stellt Autonomous Database eine Verbindung zu einem AWS Glue Data Catalog in der Region uk-london-1
her. Da es sich um eine AWS Glue Data Catalog-Verbindung handelt, ist der Parameter catalog_id
nicht erforderlich.
BEGIN
DBMS_DCAT.SET_DATA_CATALOG_CONN(
region=>'uk-london-1',
catalog_type=>'AWS_GLUE'
END;
/
Übergeordnetes Thema: Zusammenfassung der Unterprogramme zur Verbindungsverwaltung
Prozedur UNSET_DATA_CATALOG_CONN
Mit diesem Verfahren wird eine vorhandene Data Catalog-Verbindung entfernt.
Syntax
Beim Aufrufen dieser Prozedur werden alle geschützten Schemas und externen Tabellen gelöscht, die im Rahmen vorheriger Synchronisierungen erstellt wurden. Sie wirkt sich nicht auf die Metadaten in Data Catalog aus.
PROCEDURE DBMS_DCAT.UNSET_DATA_CATALOG_CONN (
dcat_con_id IN VARCHAR2 DEFAULT NULL
);
Parameter
Parameter | Beschreibung |
---|---|
dcat_con_id |
Die eindeutige Data Catalog-Verbindungs-ID. Der Standardwert ist Null. |
Übergeordnetes Thema: Zusammenfassung der Unterprogramme zur Verbindungsverwaltung
Übersicht über Synchronisierungsunterprogramme
Mit den in dieser Tabelle aufgeführten Prozeduren können Sie eine Synchronisierung ausführen, einen Synchronisierungsjob erstellen und löschen sowie synchronisierte Schemas löschen.
Am 4. April 2022 wurden die Parameter
sync_option
und grant_read
der Prozedur DBMS_DCAT.RUN_SYNC
hinzugefügt. Um die korrekte Performance von geplanten Synchronisierungsjobs sicherzustellen, die vor diesem Datum erstellt wurden, müssen Sie die geplanten Synchronisierungsjobs löschen und neu erstellen. Siehe Prozedur DBMS_DCAT.DROP_SYNC_JOB und Prozedur DBMS_DCAT.CREATE_SYNC_JOB.
Unterprogramm | Beschreibung |
---|---|
Prozedur CREATE_SYNC_JOB | Scheduler-Job erstellen, um RUN_SYNC regelmäßig aufzurufen
|
Prozedur DROP_SYNC_JOB | Vorhandenen Synchronisierungsjob für die angegebene eindeutige Verbindungs-ID löschen |
Prozedur DROP_SYNCED_SCHEMAS | Alle zuvor synchronisierten Schemas für die angegebene eindeutige Verbindungs-ID löschen |
Prozedur RUN_SYNC | Synchronisierungsvorgang ausführen |
- Prozedur RUN_SYNC
Diese Prozedur führt einen Synchronisierungsvorgang aus und ist der Einstiegspunkt für die Synchronisierung. Als Eingabe werden Listen ausgewählter Datenkatalogassets, -ordner und -entitys erstellt, gelöscht und geändert. - Prozedur CREATE_SYNC_JOB
Mit dieser Prozedur wird ein Scheduler-Job erstellt, umRUN_SYNC
regelmäßig aufzurufen. - Prozedur DROP_SYNC_JOB
Bei diesem Verfahren wird ein vorhandener Synchronisierungsjob für die angegebene eindeutige Verbindungs-ID gelöscht. - Prozedur DROP_SYNCED_SCHEMAS
Bei dieser Prozedur werden alle zuvor synchronisierten Schemas für die angegebene eindeutige Verbindungs-ID gelöscht.
Übergeordnetes Thema: DBMS_DCAT Package
Prozedur RUN_SYNC
Diese Prozedur führt einen Synchronisierungsvorgang aus und ist der Einstiegspunkt für die Synchronisierung. Als Eingabe werden Listen ausgewählter Datenkatalogassets, -ordner und -entitys erstellt, gelöscht und geändert.
Der Parameter sync_option
gibt an, welchen Vorgang die Prozedur RUN_SYNC
ausführt: SYNC
, DELETE
oder REPLACE
. Der Vorgang wird über Entitys im Geltungsbereich des Parameters synced_objects
ausgeführt.
Jeder Aufruf der Prozedur RUN_SYNC
gibt eine eindeutige operation_id
zurück, mit der die View USER_LOAD_OPERATIONS
abgefragt werden kann, um Informationen zum Status der Synchronisierung und der entsprechenden log_table
abzurufen. Die Ansicht DBMS_DCAT$SYNC_LOG
kann abgefragt werden, um einfachen Zugriff auf die log_table
für den letzten vom aktuellen Benutzer ausgeführten Synchronisierungsvorgang zu erhalten. Weitere Details finden Sie unter DBMS_DCAT$SYNC_LOG View und Monitoring and Troubleshooting Loads.
Am 4. April 2022 wurden die Parameter
sync_option
und grant_read
der Prozedur RUN_SYNC
hinzugefügt. Um die korrekte Performance von geplanten Synchronisierungsjobs sicherzustellen, die vor diesem Datum erstellt wurden, müssen Sie die geplanten Synchronisierungsjobs löschen und neu erstellen. Siehe Prozedur DBMS_DCAT.DROP_SYNC_JOB und Prozedur DBMS_DCAT.CREATE_SYNC_JOB.
Partitionierte logische Entitys oder Glue-Tabellen synchronisieren
Die Prozedur RUN_SYNC
erstellt eine partitionierte externe Tabelle für jede logische Entity oder Glue-Tabelle, wenn alle drei der folgenden Befehle angewendet werden:
- Die logische Entity oder Glue-Tabelle des OCI-Datenkatalogs weist mindestens ein partitioniertes Attribut auf.
- Bei OCI-Datenkatalogen wird die logische Entity aus einem präfixbasierten Dateinamensmuster abgeleitet. Partitionierte logische Entitys, die von regex-basierten Mustern abgeleitet werden, werden nicht unterstützt.
- Bei OCI-Datenkatalogen basiert die logische Entity auf partitionierten Daten, die dem Hive- oder Nicht-Hive-Ordnerformat folgen. Logische Entitys, die auf partitionierten Daten basieren, die dem Nicht-Hive-Format unter Verwendung von Objektnamen folgen, werden nicht unterstützt.
-
Beispiel1. Logische Entitys basierend auf durch Harvesting erstellten Objekten, die dem Partitionierungsformat im Hive-Stil mit präfixbasierten Dateinamensmustern folgen.
Betrachten Sie die folgenden Objekte:Bucket: MYBUCKET cluster1/db1.db/sales/country=USA/year=2020/month=01/sales1.csv cluster1/db1.db/sales/country=USA/year=2020/month=01/sales2.csv cluster1/db1.db/sales/country=USA/year=2020/month=02/sales1.csv
Beim Harvesting des Buckets mit einem Dateinamensmuster mit dem Startordnerpräfix
cluster1/db1.db
wird eine logische Entity namensSALES
mit drei Partitionsattributen generiert:country
,year
undmonth
. Der Typ für partitionierte Attribute istPartition
, während der Typ für nicht partitionierte AttributePrimitive
ist. - Beispiel2. Logische Entitys basierend auf durch Harvesting erstellten Objekten, die dem Partitionierungsformat im Nicht-Hive-Stil mit präfixbasierten Dateinamensmustern folgen.
Betrachten Sie die folgenden Objekte:
Bucket: MYBUCKET cluster2/db2.db/sales/USA/2020/01/sales1.csv cluster2/db2.db/sales/USA/2020/01/sales2.csv cluster2/db2.db/sales/USA/2020/02/sales1.csv
Beim Harvesting des Buckets mit einem Dateinamensmuster mit dem Startordnerpräfix
cluster2/db2.db
wird eine logische Entity namensSALES
mit drei Partitionsattributen generiert:name0
, name1 undname2
. Der einzige Unterschied zwischen der generierten logischen Entity und Beispiel 1 besteht darin, dass die Namen der partitionierten Attribute automatisch generiert werden, während sie in Beispiel 1 aus der URL extrahiert werden (country
,year
undmonth
).
-
Ein vollständiges End-to-End-Beispiel für die Synchronisierung partitionierter logischer Entitys finden Sie in Beispiel: Ein partitioniertes Datenszenario.
Inkrementelle Synchronisierung von partitionierten logischen Entitys/Glue-Tabellen
Jeder Aufruf der Prozedur RUN_SYNC
gibt eine Gruppe logischer OCI Data Catalog-Entitys oder AWS Glue-Tabellen an, die mit der Datenbank synchronisiert werden sollen. Wenn eine logische Entity oder Glue-Tabelle in zwei RUN_SYNC
-Aufrufen vorhanden ist, behält der zweite Aufruf vorhandene externe Tabellen bei und ändert sie möglicherweise. Die folgende Tabelle zeigt, welche Änderungen der logischen Entity oder Glue-Tabelle unterstützt werden, wenn die logische Entity oder Glue-Tabelle partitioniert ist:
Änderung der logischen Entity oder Glue-Tabelle | Aktion |
---|---|
Hinzufügen, Entfernen oder Aktualisieren einer Partition |
Alle Partitionen der externen partitionierten Tabelle werden aktualisiert, unabhängig davon, ob eine Änderung vom Datenkatalog erkannt wurde. |
Hinzufügen eines partitionierten Attributs |
Das Hinzufügen einer partitionierten Spalte zu einer externen partitionierten Tabelle wird nicht unterstützt. Eine Ausnahme wird ausgelöst. |
Löschen eines Partitionsattributs |
Das Löschen einer partitionierten Spalte aus einer externen partitionierten Tabelle wird nicht unterstützt. Eine Ausnahme wird ausgelöst. |
Umbenennen eines partitionierten Attributs |
Das Umbenennen einer partitionierten Spalte in einer externen partitionierten Tabelle wird nicht unterstützt. Eine Ausnahme wird ausgelöst. |
Syntax
PROCEDURE DBMS_DCAT.RUN_SYNC (
synced_objects IN CLOB,
sync_option IN VARCHAR2 DEFAULT 'SYNC',
error_semantics IN VARCHAR2 DEFAULT 'SKIP_ERRORS',
log_level IN VARCHAR2 DEFAULT 'INFO',
grant_read IN VARCHAR2 DEFAULT NULL,
dcat_con_id IN VARCHAR2 DEFAULT NULL
);
PROCEDURE DBMS_DCAT.RUN_SYNC (
synced_objects IN CLOB,
sync_option IN VARCHAR2 DEFAULT 'SYNC',
error_semantics IN VARCHAR2 DEFAULT 'SKIP_ERRORS',
log_level IN VARCHAR2 DEFAULT 'INFO',
grant_read IN VARCHAR2 DEFAULT NULL,
operation_id OUT NOCOPY NUMBER,
dcat_con_id IN VARCHAR2 DEFAULT NULL
);
Parameter
Parameter | Beschreibung |
---|---|
|
Dieser Parameter ist ein JSON-Dokument, das die zu synchronisierenden Datenkatalogobjekte angibt. Für OCI Data Catalogs gibt das JSON-Dokument eine Gruppe von Entitys mit mehreren Granularitäten an: Datenassets, Ordner (Objektspeicher-Buckets) oder logische Entitys. Es enthält eine Für AWS Glue Data Catalogs gibt das JSON-Dokument eine Liste von Tabellen mit mehreren Granularitäten an: Datenbanken, Tabellen. Das Dokument gibt eine Liste von Datenbanken an. Benutzer können die Gruppe der zu synchronisierenden Tabellen einschränken, indem sie einzelne Tabellen innerhalb einer Datenbank angeben. |
sync_option |
(Optional) Es stehen drei Optionen zur Verfügung:
|
|
(Optional) Dieser Parameter gibt das Fehlerverhalten an. Wenn dieser Wert auf |
|
(Optional) Dieser Parameter gibt die folgenden Werte bei der Erhöhung der Loggingdetails an: (OFF , FATAL , ERROR , WARN , INFO , DEBUG , TRACE , ALL ). Der Standardwert ist INFO .
|
grant_read |
(Optional) Dieser Parameter ist eine Liste von Benutzern/Rollen, denen automatisch READ-Berechtigungen für alle externen Tabellen erteilt werden, die durch diesen Aufruf von RUN_SYNC verarbeitet werden. Alle Benutzer/Rollen in der Liste grant_read erhalten READ-Berechtigungen für alle neuen oder bereits vorhandenen externen Tabellen, die den mit dem Parameter synced_objects angegebenen Entitys entsprechen. Die Prozedur RUN_SYNC behält bereits erteilte Berechtigungen für synchronisierte externe Tabellen bei.
|
|
(Optional) Dieser Parameter wird verwendet, um den entsprechenden Eintrag in Hinweis: Eine Version von |
dcat_con_id |
Dieser Parameter ist die eindeutige Data Catalog-Verbindungs-ID, die beim Erstellen der Verbindung zum Data Catalog angegeben wurde. Siehe Prozedur DBMS_DCAT SET_DATA_CATALOG_CONN. Dieser Parameter gibt an, welche Verbindung für die Synchronisierung verwendet wird, und wird Teil des abgeleiteten Schemanamens. Eine Beschreibung der Ableitung des Schemanamens finden Sie unter Synchronisierungszuordnung. Der Standardwert des Parameters ist NULL. |
Beispiel: Alle OCI Data Catalog-Entitys synchronisieren
Im folgenden Beispiel werden alle Data Catalog-Entitys synchronisiert.
EXEC DBMS_DCAT.RUN_SYNC(synced_objects=>'{"asset_list":["*"]}');
Beispiel: synced_objects
-Parameter zum Synchronisieren aller OCI Data Catalog-Datenassets
Im Folgenden finden Sie einen Beispielparameter synced_objects
zum Synchronisieren aller (Object Storage-)Datenassets im Data Catalog.
{"asset_list" : ["*"]}
Beispiel: synced_objects
-Parameter zum Synchronisieren bestimmter OCI Data Catalog-Datenassets
Im Folgenden finden Sie einen Beispielparameter synced_objects
zum Synchronisieren von zwei Datenassets.
{"asset_list": [
{
"asset_id":"0b320de9-8411-4448-91fb-9e2e7f78fd5f"
},
{
"asset_id":"0b320de9-8411-4448-91fb-9e2e7f74523"
}
]}
Beispiel: synced_objects
Parameter zum Synchronisieren bestimmter OCI Data Catalog-Entitys in einem Datenasset
Im Folgenden ist ein Beispielparameter synced_objects
zum Synchronisieren von zwei Entitys innerhalb des Datenassets dargestellt.
{"asset_list": [
{
"asset_id":"0b320de9-8411-4448-91fb-9e2e7f78fd5f",
"folder_list":[
"f1",
"f2"
]
}
]}
Beispiel: synced_objects
Parameter zum Synchronisieren bestimmter OCI Data Catalog-Ordner und -Entitys in einem Datenasset
Im Folgenden ist ein Beispiel für den Parameter synced_objects
zum Synchronisieren von zwei Ordnern und zwei Entitys innerhalb des Datenassets dargestellt.
{"asset_list":[
{
"asset_id":"0b320de9-8411-4448-91fb-9e2e7f78fd5f",
"entity_list": [
"entity1",
"entity2"
],
"folder_list": [
"f1",
"f2"
]
}
]}
Beispiel: Parameter synced_objects
für die Synchronisierung aller AWS Glue Data Catalog-Datenbanken
Im Folgenden wird ein Beispiel für den Parameter synced_objects
für die Synchronisierung aller Datenbanken im AWS Glue Data Catalog gezeigt.
{"database_list":["*"]}
Beispiel: Parameter synced_objects
zum Synchronisieren von zwei AWS Glue Data Catalog-Datenbanken
Im Folgenden ist ein Beispiel für den Parameter synced_objects
zum Synchronisieren von zwei AWS Glue Data Catalog-Datenbanken dargestellt.
{"database_list":[
{"database":"tpcdscsv"},
{"database":"tpcdsparquet"} ]}
Beispiel: Parameter synced_objects
für die Synchronisierung von drei AWS Glue Data Catalog-Datenbanken
Im Folgenden ist ein Beispiel für den Parameter synced_objects
zum Synchronisieren von drei Tabellen aus einer AWS Glue Data Catalog-Datenbank dargestellt.
{"database_list":[
{"database":"tpcdsparquet",
"table_list": [ "tpcdsparquet_customer",
"tpcdsparquet_item",
"tpcdsparquet_web_sales" ] } ]}
Übergeordnetes Thema: Zusammenfassung der Synchronisierungsunterprogramme
Prozedur CREATE_SYNC_JOB
Mit dieser Prozedur wird ein Scheduler-Job erstellt, um RUN_SYNC
regelmäßig aufzurufen.
Als Eingabe werden die Gruppe der zu synchronisierenden Objekte, die Fehlersemantik, die Logebene und ein Wiederholungsintervall verwendet. Weitere Informationen zur Funktionsweise der Synchronisierung finden Sie unter Prozedur DBMS_DCAT RUN_SYNC.
Es kann nur ein einzelner Synchronisierungsjob vorhanden sein. Die Prozedur CREATE_SYNC_JOB
ist nicht erfolgreich, wenn bereits ein anderer Job angegeben ist, es sei denn, der Force-Parameter ist auf TRUE
gesetzt. Wenn Force auf TRUE
gesetzt ist, wird der vorherige Job gelöscht.
Wenn ein Scheduler-Job versucht, während eine andere Synchronisierung ausgeführt wird, verläuft der Scheduler-Job nicht erfolgreich.
Am 4. April 2022 wurden die Parameter
sync_option
und grant_read
der Prozedur RUN_SYNC
hinzugefügt. Um die korrekte Performance von geplanten Synchronisierungsjobs sicherzustellen, die vor diesem Datum erstellt wurden, müssen Sie die geplanten Synchronisierungsjobs löschen und neu erstellen. Siehe Prozedur DBMS_DCAT.DROP_SYNC_JOB und Prozedur DBMS_DCAT.CREATE_SYNC_JOB.
Syntax
PROCEDURE DBMS_DCAT.CREATE_SYNC_JOB (
synced_objects IN CLOB,
error_semantics IN VARCHAR2 DEFAULT 'SKIP_ERRORS',
log_level IN VARCHAR2 DEFAULT 'INFO',
repeat_interval IN VARCHAR2,
force IN VARCHAR2 DEFAULT 'FALSE',
grant_read IN VARCHAR2 DEFAULT NULL,
sync_option IN VARCHAR2 DEFAULT 'SYNC',
dcat_con_id IN VARCHAR2 DEFAULT NULL
);
Parameter
Parameter | Beschreibung |
---|---|
|
Ein JSON-Objekt, das die zu synchronisierenden Objekte angibt, wie in der Prozedur |
error_semantics |
(Optional) Fehlerverhalten, wie für |
log_level |
(Optional) Logging-Ebene, wie für |
repeat_interval |
Wiederholungsintervall für den Job mit derselben Semantik wie der Wiederholungsintervallparameter der Prozedur |
force |
(Optional) Wenn |
grant_read |
(Optional) Liste der Benutzer/Rollen, denen READ in den synchronisierten externen Tabellen erteilt werden soll, wie unter RUN_SYNC beschrieben. Siehe Prozedur DBMS_DCAT.RUN_SYNC.
|
sync_option |
(Optional) Verhalten in Bezug auf Entitys, die bereits mit einem vorherigen RUN_SYNC -Vorgang synchronisiert wurden, wie in Prozedur RUN_SYNC beschrieben. Siehe Prozedur DBMS_DCAT.RUN_SYNC.
|
dcat_con_id |
Dieser Parameter ist die eindeutige Data Catalog-Verbindungs-ID, die beim Erstellen der Verbindung zu Data Catalog angegeben wurde. Siehe Prozedur DBMS_DCAT SET_DATA_CATALOG_CONN. Dieser Parameter gibt an, welche Verbindung für die Synchronisierung verwendet wird, und wird Teil des abgeleiteten Schemanamens. Eine Beschreibung der Ableitung des Schemanamens finden Sie unter Synchronisierungszuordnung. Der Standardwert des Parameters ist NULL. |
Übergeordnetes Thema: Zusammenfassung der Synchronisierungsunterprogramme
Prozedur DROP_SYNC_JOB
Bei dieser Prozedur wird ein vorhandener Synchronisierungsjob für die angegebene eindeutige Verbindungs-ID gelöscht.
Syntax
PROCEDURE DBMS_DCAT.DROP_SYNC_JOB (
dcat_con_id IN VARCHAR2 DEFAULT NULL
);
Parameter
Parameter | Beschreibung |
---|---|
dcat_con_id |
Die eindeutige Data Catalog-Verbindungs-ID. Der Standardwert ist NULL. |
Übergeordnetes Thema: Zusammenfassung der Synchronisierungsunterprogramme
Prozedur DROP_SYNCED_SCHEMAS
Bei diesem Verfahren werden alle zuvor synchronisierten Schemas für die angegebene eindeutige Verbindungs-ID gelöscht.
Syntax
PROCEDURE DBMS_DCAT.DROP_SYNCED_SCHEMAS (
dcat_con_id IN VARCHAR2 DEFAULT NULL
);
Parameter
Parameter | Beschreibung |
---|---|
dcat_con_id |
Die eindeutige Data Catalog-Verbindungs-ID. Der Standardwert ist NULL. |
Übergeordnetes Thema: Zusammenfassung der Synchronisierungsunterprogramme
Übersicht über Data Catalog-Ansichten
Die Data Catalog-Integration mit Autonomous Database bietet zahlreiche Tabellen und Views.
Die folgenden Tabellen und Views helfen Ihnen dabei, Folgendes zu verstehen:
- Verfügbare Datenkatalogassets. Informationen zu allen Arten von Data Catalog-Assets abrufen, einschließlich Datenbanken, Objektspeichern und mehr.
- Informationen zu den Data Catalog Object Storage-Assets und -Entitys, die mit Autonomous Database synchronisiert wurden. Dazu gehören Details dazu, wie Data Catalog-Elemente (Assets, Ordner und Entitys) Autonomous Database-Objekten zugeordnet werden (d.h. Schemas und externe Tabellen).
- Metadatensynchronisierungsausführungen. Prüfen Sie Details zu Synchronisierungsjobs, einschließlich aller Probleme, die während der Synchronisierung aufgetreten sind.
In dieser Tabelle werden die Tabellen und Views aufgeführt, die vom Package DBMS_DCAT
bereitgestellt werden.
Anzeigen | Beschreibung |
---|---|
ALL_CLOUD_CATALOG_DATABASES Ansicht | Informationen zu OCI Data Catalog-Datenassets und AWS Glue Data Catalog-Datenbanken anzeigen |
ALL_CLOUD_CATALOG_TABLES Ansicht | Wird zum Anzeigen von Informationen zu Datenentitys für OCI Data Catalogs und Tabellen für AWS Glue Data Catalogs verwendet |
ALL_DCAT_ASSETS Ansicht | Datenkatalogassets auflisten, auf die diese Datenbank zugreifen darf |
ALL_DCAT_ATTRIBUTES Ansicht | Datenkatalogattribute auflisten, auf die diese Datenbank zugreifen darf |
ALL_DCAT_CONNECTIONS Ansicht | Eine View, die Informationen zu den mit dieser Instanz verbundenen Datenkatalogen enthält |
ALL_DCAT_ENTITIES Ansicht |
Listet logische Entitys auf, auf die diese Datenbank zugreifen darf |
ALL_DCAT_FOLDERS Ansicht | Metadaten für die Object Storage-Buckets auflisten, die Datendateien für die logischen Entitys enthalten |
ALL_DCAT_GLOBAL_ACCESSIBLE_CATALOGS Ansicht | Alle verfügbaren Kataloge in allen Regionen zusammen mit der Zugriffsebene für jeden Katalog auflisten |
ALL_DCAT_LOCAL_ACCESSIBLE_CATALOGS Ansicht | Alle verfügbaren Kataloge im aktuellen Bereich zusammen mit der Zugriffsebene für jeden Katalog auflisten |
ALL_GLUE_DATABASES Ansicht | Listet die AWS Glue Data Catalog-Datenbanken auf, auf die die Datenkatalogzugangsdaten zugreifen dürfen |
ALL_GLUE_TABLES Ansicht | Zeigt alle AWS Glue Data Catalog-Tabellen an, auf die Datenkatalogzugangsdaten zugreifen dürfen |
DCAT_ATTRIBUTES Ansicht | Zuordnung logischer Entityattribute zu externen Tabellenspalten auflisten |
DCAT_ENTITIES Ansicht | Beschreibt die Zuordnung von logischen Entitys zu externen Tabellen |
DBMS_DCAT$SYNC_LOG-Ansicht | Einfacher Zugriff auf die Logtabelle für den letzten vom aktuellen Benutzer ausgeführten Synchronisierungsvorgang |
- ALL_CLOUD_CATALOG_DATABASES Ansicht
Verwenden Sie die AnsichtALL_CLOUD_CATALOG_DATABASES
, um Informationen zu OCI Data Catalog-Datenassets und AWS Glue Data Catalog-Datenbanken anzuzeigen. - ALL_CLOUD_CATALOG_TABLES Ansicht
Mit der AnsichtALL_CLOUD_CATALOG_TABLES
werden Informationen zu Datenentitys für OCI-Datenkataloge und Tabellen für AWS Glue Data Catalogs angezeigt. - ALL_DCAT_ASSETS Ansicht
Die Datenkatalogassets, auf die diese Datenbank zugreifen darf. - ALL_DCAT_ATTRIBUTES Ansicht
Die Datenkatalogattribute, auf die diese Datenbank zugreifen darf. - ALL_DCAT_CONNECTIONS Ansicht
Eine Ansicht, die Informationen zu den mit dieser Instanz verbundenen Datenkatalogen enthält. - ALL_DCAT_ENTITIES Ansicht
Die logischen Entitäten des Datenkatalogs, auf die diese Datenbank zugreifen darf. - ALL_DCAT_FOLDERS View
Metadaten für die Object Storage-Buckets mit den Datendateien für die logischen Entitys. - ALL_DCAT_GLOBAL_ACCESSIBLE_CATALOGS Ansicht
In dieser Ansicht werden alle verfügbaren Kataloge über alle Regionen hinweg sowie die Zugriffsebene für jeden Katalog aufgeführt. - ALL_DCAT_LOCAL_ACCESSIBLE_CATALOGS Ansicht
In dieser Ansicht werden alle verfügbaren Kataloge in der aktuellen Region sowie die Zugriffsebene für jeden Katalog aufgeführt. - ALL_GLUE_DATABASES Ansicht
Die AWS Glue Data Catalog-Datenbanken, für die Datenkatalogzugangsdaten autorisiert sind. - ALL_GLUE_TABLES Ansicht
Diese Ansicht zeigt alle AWS Glue Data Catalog-Tabellen an, auf die Datenkatalogzugangsdaten zugreifen dürfen. - DCAT_ATTRIBUTES Ansicht
Listet die Zuordnung logischer Entityattribute zu externen Tabellenspalten auf. - DCAT_ENTITIES Ansicht
Beschreibt die Zuordnung von logischen Entitys zu externen Tabellen. - DBMS_DCAT$SYNC_LOG-Ansicht
Die AnsichtDBMS_DCAT$SYNC_LOG
bietet einfachen Zugriff auf die Logtabelle für den letzten vom aktuellen Benutzer ausgeführten Synchronisierungsvorgang.
Übergeordnetes Thema: DBMS_DCAT Package
ALL_CLOUD_CATALOG_DATABASES Ansicht
Verwenden Sie die Ansicht ALL_CLOUD_CATALOG_DATABASES
, um Informationen zu OCI Data Catalog-Datenassets und AWS Glue Data Catalog-Datenbanken anzuzeigen.
Spalte | Beschreibung |
---|---|
DCAT_CON_ID |
CON1 |
CATALOG_ID |
Eindeutige ID des Datenkatalogs.
Beispiel für OCI Data Catalog:
Beispiel für AWS Glue-Datenkatalog:
|
NAME |
Name des Datenassets (OCI)/ der Datenbank (AWS Glue).
Beispiel für OCI Data Catalog:
Beispiel für AWS Glue-Datenkatalog:
|
DESCRIPTION |
Beschreibung des Datenassets (OCI)/ der Datenbank (AWS Glue).
Beispiel für OCI Data Catalog:
Beispiel für AWS Glue-Datenkatalog:
|
TIME_CREATED |
Datum und Uhrzeit der Erstellung des Datenassets (OCI)/der Datenbanken (AWS Glue) im Datenkatalog.
Beispiel für OCI Data Catalog:
Beispiel für AWS Glue-Datenkatalog:
|
DETAILS |
JSON-Dokument mit Metadaten zu jeder Datenentity (OCI)/Datenbank (AWS Glue).
Beispiel für OCI Data Catalog:
Beispiel für AWS Glue-Datenkatalog:
|
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
ALL_CLOUD_CATALOG_TABLES Ansicht
Mit der Ansicht ALL_CLOUD_CATALOG_TABLES
werden Informationen zu Datenentitys für OCI Data Catalogs und Tabellen für AWS Glue Data Catalogs angezeigt.
Spalte | Beschreibung |
---|---|
DCAT_CON_ID |
Eindeutige ID des Datenkatalogs. Verbindungs-ID.
Beispiel für OCI Data Catalog: Beispiel für AWS Glue-Datenkatalog: |
CATALOG_ID |
Eindeutige ID des Datenkatalogs.
Beispiel für OCI Data Catalog: Beispiel für AWS Glue-Datenkatalog:
|
DATABASE_NAME |
Name des Datenassets (OCI)/ der Datenbank (AWS Glue).
Beispiel für OCI Data Catalog: Beispiel für AWS Glue-Datenkatalog: |
NAME |
Name der Datenentity (OCI)/Tabelle (AWS Glue).
Beispiel für OCI Data Catalog: Beispiel für AWS Glue-Datenkatalog: |
DESCRIPTION |
Beschreibung der Datenentity (OCI)/Tabelle (AWS Glue).
Beispiel für OCI Data Catalog: Beispiel für AWS Glue Data Catalog: |
TIME_CREATED |
Datum und Uhrzeit der Erstellung der Datenentity (OCI)/Tabelle (AWS Glue) im Datenkatalog.
Beispiel für OCI Data Catalog: Beispiel für AWS Glue Data Catalog: |
TIME_UPDATED |
Letztes Mal wurde eine Änderung an der Datenentity (OCI)/Tabelle (AWS Glue) vorgenommen.
Beispiel für OCI Data Catalog: Beispiel für AWS Glue Data Catalog: |
DETAILS |
JSON-Dokument mit Metadaten zu jeder Datenentity (OCI)/Tabelle (AWS Glue)
Beispiel für OCI Data Catalog:
Beispiel für AWS Glue-Datenkatalog:
|
Beispiel
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
ALL_DCAT_ASSETS Ansicht
Die Datenkatalogassets, auf die diese Datenbank zugreifen darf.
Spalte | Datentyp | Beschreibung |
---|---|---|
DCAT_CON_ID |
VARCHAR2 (4000) |
Verbindungs-ID, die innerhalb der Instanz eindeutig ist |
|
VARCHAR2(4000) |
Anlagenschlüssel |
DISPLAY_NAME |
VARCHAR2(4000) |
Assetanzeigename |
DESCRIPTION |
VARCHAR2(4000) |
Assetbeschreibung |
CATALOG_ID |
VARCHAR2(4000) |
OCID für den Datenkatalog, der das Asset enthält |
EXTERNAL_KEY |
VARCHAR2(4000) |
Basisobjektspeicher-URI für das Asset |
URI |
VARCHAR2(4000) |
Asset-URI für die Data Catalog-API |
TIME_CREATED |
TIMESTAMP(6) WITH TIMEZONE |
Datum und Uhrzeit der Erstellung des Datenassets |
TYPE_KEY |
VARCHAR2(4000) |
Der Schlüssel des Datenassettyps (derzeit werden nur Object Storage-Datenassets unterstützt). Typschlüssel finden Sie über den Data Catalog-Endpunkt "/types". |
LIFECYCLE_STATE |
VARCHAR2(4000) |
Der aktuelle Status des Datenassets. Weitere Informationen zu möglichen Lebenszyklusstatus finden Sie in der DataAsset-Referenz des Datenkatalogs. Dort finden Sie eine Liste der möglichen Status für lifecycleState .
|
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
ALL_DCAT_ATTRIBUTES Ansicht
Die Datenkatalogattribute, auf die diese Datenbank zugreifen darf.
Spalte | Datentyp | Beschreibung |
---|---|---|
DCAT_CON_ID |
VARCHAR2 (4000) |
Verbindungs-ID, die innerhalb der Instanz eindeutig ist |
KEY |
NUMBER |
Attributschlüssel |
|
VARCHAR2(4000) |
Attribut-Anzeigename |
BUSINESS_NAME |
VARCHAR2(4000) |
Attributgeschäftsname |
DESCRIPTION |
VARCHAR2(4000) |
Attributbeschreibung |
DATA_ASSET_KEY |
VARCHAR2(4000) |
Datenassetschlüssel |
FOLDER_KEY |
VARCHAR2(4000) |
Ordnerschlüssel |
ENTITY_KEY |
VARCHAR2(4000) |
Entitätsschlüssel |
EXTERNAL_KEY |
VARCHAR2(4000) |
Eindeutiger externer Schlüssel für das Attribut |
LENGTH |
NUMBER |
Maximal zulässige Länge des Attributwerts |
PRECISION |
NUMBER |
Genauigkeit des Attributwerts (gilt normalerweise für Gleitkommazahlen-Datentyp) |
SCALE |
NUMBER |
Skalierung des Attributwerts (gilt normalerweise für Gleitkommazahlen-Datentyp) |
IS_NULLABLE |
NUMBER |
Gibt an, ob diesem Attribut Nullwerte zugewiesen werden können |
URI |
VARCHAR2(4000) |
URI zur Attributinstanz in der Data Catalog-API |
LIFECYCLE_STATE |
VARCHAR2(4000) |
Der aktuelle Status des Attributs. Weitere Informationen zu möglichen Lebenszyklusstatus finden Sie in der Attributreferenz des Datenkatalogs für eine Liste der möglichen Status für lifecycleState .
|
TIME_CREATED |
TIMESTAMP(6) WITH TIME ZONE |
Datum und Uhrzeit der Erstellung des Attributs |
EXTERNAL_DATA_TYPE |
VARCHAR2(4000) |
Datentyp des Attributs, wie im externen System definiert |
MIN_COLLECTION_COUNT |
NUMBER |
Mindestanzahl von Elementen, wenn der Attributtyp ein Collection-Typ ist |
MAX_COLLECTION_COUNT |
NUMBER |
Maximale Anzahl Elemente, wenn der Attributtyp ein Collection-Typ ist |
DATATYPE_ENTITY_KEY |
VARCHAR2(4000) |
Entitätsschlüssel, der den Datentyp dieses Attributs darstellt. Gilt, wenn dieses Attribut ein komplexer Typ ist |
EXTERNAL_DATATYPE_ENTITY_KEY |
VARCHAR2(4000) |
Externer Entitätsschlüssel, der den Datentyp dieses Attributs darstellt, anwendbar, wenn dieses Attribut ein komplexer Typ ist |
PARENT_ATTRIBUTE_KEY |
VARCHAR2(4000) |
Attributschlüssel, der das übergeordnete Attribut dieses Attributs darstellt, anwendbar, wenn das übergeordnete Attribut einen komplexen Datentyp aufweist |
EXTERNAL_PARENT_ATTRIBUTE_KEY |
VARCHAR2(4000) |
Externer Attributschlüssel, der das übergeordnete Attribut dieses Attributs darstellt, anwendbar, wenn das übergeordnete Attribut vom Typ "Komplex" ist |
PATH |
VARCHAR2(4000) |
Vollständiger Pfad des Attributs |
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
ALL_DCAT_CONNECTIONS Ansicht
Eine View, die Informationen zu den mit dieser Instanz verbundenen Datenkatalogen enthält.
Spalte | Datentyp | Beschreibung |
---|---|---|
DCAT_CON_ID |
VARCHAR2(4000) |
Verbindungs-ID, die innerhalb der Instanz eindeutig ist |
COMPARTMENT_ID |
VARCHAR2(4000) |
OCID für das Compartment, in dem sich die Data Catalog-Instanz befindet |
INSTANCE_ID |
VARCHAR2(4000) |
OCID für die Data Catalog-Instanz |
|
VARCHAR2(4000) |
Region für die Data Catalog-Instanz |
ENDPOINT |
VARCHAR2(4000) |
Endpunkt für die Data Catalog-Instanz |
CREATED |
TIMESTAMP |
Beim Erstellen der Data Catalog-Instanz |
NAME |
VARCHAR2(4000) |
Name der Data Catalog-Instanz |
LAST_UPDATED |
TIMESTAMP |
Zeitstempel der letzten Aktualisierung der Verbindung zur Data Catalog-Instanz |
LATEST_OPERATION_ID |
NUMBER |
Die ID des letzten Synchronisierungsvorgangs |
DATA_CATALOG_CREDENTIAL |
VARCHAR2(128) |
Zugangsdaten für den Zugriff auf den Datenkatalog |
OBJECT_STORE_CREDENTIAL |
VARCHAR2(128) |
Zugangsdaten, die vom externen Tabellentreiber für den Zugriff auf den Objektspeicher verwendet werden |
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
ALL_DCAT_ENTITIES Ansicht
Die logischen Entitys des Datenkatalogs, auf die diese Datenbank zugreifen darf.
Spalte | Datentyp | Beschreibung |
---|---|---|
DCAT_CON_ID |
VARCHAR2(4000) |
Verbindungs-ID, die innerhalb der Instanz eindeutig ist |
CATALOG_ID |
VARCHAR2(4000) |
OCID für den Datenkatalog, der das Asset enthält |
|
VARCHAR2(4000) |
Entitätsschlüssel |
DISPLAY_NAME |
VARCHAR2(4000) |
Anzeigename einer Entity |
BUSINESS_NAME |
VARCHAR2(4000) |
Geschäftsname der Entität |
DESCRIPTION |
VARCHAR2(4000) |
Beschreibung der logischen Entity |
|
VARCHAR2(4000) |
Anlagenschlüssel |
|
VARCHAR2(4000) |
Eindeutiger Ordnerschlüssel |
FOLDER_NAME |
VARCHAR2(4000) |
Ordnername (Bucket) |
EXTERNAL_KEY |
VARCHAR2(4000) |
Externer Schlüssel für die logische Entity |
PATTERN_KEY |
VARCHAR2(4000) |
Schlüssel des zugeordneten Musters für die logische Entity |
REALIZED_EXPRESSION |
VARCHAR2(4000) |
Der reguläre Ausdruck, mit dem die Dateien für diese logische Entity abgerufen werden |
PATH |
VARCHAR2(4000) |
Vollständiger Pfad für die logische Entity |
TIME_CREATED |
TIMESTAMP(6) WITH TIME ZONE |
Datum und Uhrzeit der Entityerstellung |
TIME_UPDATED |
TIMESTAMP(6) WITH TIME ZONE |
Letzte Änderung der Datenentity |
UPDATED_BY_ID |
VARCHAR2(4000) |
OCID des Benutzers, der dieses Objekt im Datenarchiv aktualisiert hat |
URI |
VARCHAR2(4000) |
URI der Entityinstanz in der API |
LIFECYCLE_STATE |
VARCHAR2(4000) |
Der aktuelle Status der Entity. Weitere Informationen zu möglichen Lebenszyklusstatus finden Sie in der Entityreferenz des Datenkatalogs. Dort finden Sie eine Liste der möglichen Status für lifecycleState .
|
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
ALL_DCAT_FOLDERS Ansicht
Metadaten für die Object Storage-Buckets mit den Datendateien für die logischen Entitys.
Spalte | Datentyp | Beschreibung |
---|---|---|
DCAT_CON_ID |
VARCHAR2(4000) |
Verbindungs-ID, die innerhalb der Instanz eindeutig ist |
CATALOG_ID |
VARCHAR2(4000) |
OCID für den Datenkatalog, der das Asset enthält |
|
VARCHAR2(4000) |
Ordnerschlüssel |
|
VARCHAR2(4000) |
Ordneranzeigename |
BUSINESS_NAME |
VARCHAR2(4000) |
Ordner-Geschäftsname |
DESCRIPTION |
VARCHAR2(4000) |
Ordnerbeschreibung |
DATA_ASSET_KEY |
VARCHAR2(4000) |
Schlüssel für das Datenasset mit dem Ordner |
PARENT_FOLDER_KEY |
VARCHAR2(4000) |
Schlüssel für den übergeordneten Ordner (derzeit ist dies der Datenassetschlüssel) |
PATH |
VARCHAR2(4000) |
Vollständiger Pfad für den Ordner |
EXTERNAL_KEY |
VARCHAR2(4000) |
Object Storage-URI für den Bucket |
TIME_EXTERNAL |
TIMESTAMP(6) WITH TIMEZONE |
Der zuletzt geänderte Zeitstempel dieses Ordners |
TIME_CREATED |
TIMESTAMP(6) WITH TIMEZONE |
Datum und Uhrzeit der Erstellung des Ordners |
URI |
VARCHAR2(4000) |
URI zur Ordnerinstanz in der Data Catalog-API. |
LIFECYCLE_STATE |
VARCHAR2(4000) |
Der aktuelle Status des Ordners. Weitere Informationen zu möglichen Lebenszyklusstatus finden Sie in der Ordnerreferenz des Datenkatalogs. Dort finden Sie eine Liste der möglichen Status für lifecycleState .
|
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
ALL_DCAT_GLOBAL_ACCESSIBLE_CATALOGS Ansicht
In dieser Ansicht werden alle verfügbaren Kataloge über alle Regionen hinweg sowie die Zugriffsebene für jeden Katalog aufgeführt.
Spalte | Datentyp | Beschreibung |
---|---|---|
|
VARCHAR2(4000) |
Katalog-OCID |
CATALOG_NAME |
VARCHAR2(4000) |
Name des Katalogs |
CATALOG_REGION |
VARCHAR2(4000) |
Name des Katalogbereichs |
CATALOG_SCORE |
NUMBER |
Der Katalogscore ist ein numerischer Wert, der aus den Berechtigungen berechnet wird, die für die Data Catalog-Zugriffszugangsdaten konfiguriert sind. Ein höherer Katalogscore bedeutet höhere Berechtigungen, was einer höheren Wahrscheinlichkeit entspricht, dass dieser Katalog zur Verwendung mit dieser Autonomous Database-Instanz vorgesehen ist. |
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
ALL_DCAT_LOCAL_ACCESSIBLE_CATALOGS Ansicht
In dieser Ansicht werden alle verfügbaren Kataloge im aktuellen Bereich sowie die Zugriffsebene für jeden Katalog aufgeführt.
Spalte | Datentyp | Beschreibung |
---|---|---|
|
VARCHAR2(4000) |
Katalog-OCID |
CATALOG_NAME |
VARCHAR2(4000) |
Name des Katalogs |
CATALOG_SCORE |
NUMBER |
Der Katalogscore ist ein numerischer Wert, der aus den Berechtigungen berechnet wird, die für die Data Catalog-Zugriffszugangsdaten konfiguriert sind. Ein höherer Katalogscore bedeutet höhere Berechtigungen, was einer höheren Wahrscheinlichkeit entspricht, dass dieser Katalog zur Verwendung mit dieser Autonomous Database-Instanz vorgesehen ist. |
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
ALL_GLUE_DATABASES Ansicht
Die AWS Glue Data Catalog-Datenbanken, für die der Zugriff auf die Datenkatalogzugangsdaten autorisiert ist.
Spalte | Datentyp | Beschreibung |
---|---|---|
DCAT_CON_ID |
VARCHAR2(4000) |
Eindeutige ID der Data Catalog-Verbindungs-ID. |
CATALOG_ID |
VARCHAR2(255) |
Eindeutige Datenkatalog-ID. |
NAME |
VARCHAR2(255) |
Name der Datenbank. |
DESCRIPTION |
VARCHAR2(2048) |
Beschreibung der Datenbank. |
LOCATION_URI |
VARCHAR2(1024) |
Der Speicherort der Datenbank. |
CREATE_TIME |
TIMESTAMP |
Die Zeit, zu der die Datenbank im Datenkatalog erstellt wurde. |
PARAMETERS |
CLOB |
JSON-Dokument mit Schlüssel/Wert-Paaren, die Parameter und Eigenschaften der Datenbank definieren. |
TARGET_DATABASE |
VARCHAR2(4000) |
JSON-Dokument, das eine Zieldatenbank für die Ressourcenverknüpfung in AWS beschreibt. |
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
ALL_GLUE_TABLES Ansicht
In dieser Ansicht werden alle AWS Glue Data Catalog-Tabellen angezeigt, auf die Datenkatalogzugangsdaten zugreifen dürfen.
Spalte | Datentyp | Beschreibung |
---|---|---|
DCAT_CON_ID |
VARCHAR2(4000) |
Eindeutige ID der Data Catalog-Verbindungs-ID. |
CATALOG_ID |
VARCHAR2(255) |
Katalogkennung |
DATABASE_NAME |
VARCHAR2(255) |
Datenbankname |
NAME |
VARCHAR2(255) |
Tabellenname |
TABLE_TYPE |
VARCHAR2(255) |
Tabellentyp |
CLASSIFICATION |
VARCHAR2(255) |
|
DESCRIPTION |
VARCHAR2(2048) |
Tabellenbeschreibung |
OWNER |
VARCHAR2(255) |
Tabelleneigentümer |
CREATED_BY |
VARCHAR2(255) |
Tabellenersteller |
CREATE_TIME |
TIMESTAMP |
Die Zeit, zu der die Tabelle im Datenkatalog erstellt wurde. |
LAST_ANALYZED_TIME |
TIMESTAMP |
Die letzten Spaltenstatistiken wurden für diese Tabelle berechnet. |
LAST_ACCESS_TIME |
TIMESTAMP |
Das letzte Mal, als auf die Tabelle zugegriffen wurde. |
UPDATE_TIME |
TIMESTAMP |
Das letzte Mal, wenn die Tabelle aktualisiert wurde. |
IS_REGISTERED_WITH_LAKE_FORMATION |
NUMBER |
Gibt an, ob die Tabelle bei der AWS Lake-Bildung registriert ist. |
PARAMETERS |
CLOB |
JSON-Dokument mit Schlüssel/Wert-Paaren, die Eigenschaften der Tabelle definieren. |
PARTITION_KEYS |
CLOB |
JSON-Dokument mit einer Liste von Spalten, nach denen die Tabelle partitioniert ist. |
RETENTION |
NUMBER |
Die Aufbewahrungszeit für diese Tabelle. |
STORAGE_DESCRIPTION |
CLOB |
JSON-Dokument mit Informationen zum physischen Speicher einer Tabelle. |
TARGET_TABLE |
VARCHAR2(4000) |
JSON-Dokument mit einer Zieltabelle, die für die Ressourcenverknüpfung in AWS verwendet wird. |
VERSION_ID |
VARCHAR2(255) |
Die Versions-ID der Tabelle. |
VIEW_EXPANDED_TEXT |
CLOB |
Einführung von AWS Glue zur Kompatibilität mit Hive. Wird nicht von AWS Glue verwendet. |
VIEW_ORIGINAL_TEXT |
CLOB |
Einführung von AWS Glue zur Kompatibilität mit Hive. Wird nicht von AWS Glue verwendet. |
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
DCAT_ATTRIBUTES Ansicht
Führt die Zuordnung von logischen Entityattributen zu externen Tabellenspalten auf.
Spalte | Datentyp | Beschreibung |
---|---|---|
DCAT_CON_ID |
VARCHAR2 (4000) |
Verbindungs-ID, die innerhalb der Instanz eindeutig ist |
ASSET_KEY |
VARCHAR2(4000) |
Datenkatalogassetschlüssel |
|
VARCHAR2(4000) |
Data Catalog-Entityschlüssel |
|
VARCHAR2(4000) |
Data Catalog-Attributschlüssel |
ORACLE_COLUMN_NAME |
VARCHAR2(128) |
Zugeordneter Spaltenname |
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
DCAT_ENTITIES Ansicht
Beschreibt die Zuordnung von logischen Entitys zu externen Tabellen.
Spalte | Datentyp | Beschreibung |
---|---|---|
DCAT_CON_ID |
VARCHAR2(4000) |
Verbindungs-ID, die innerhalb der Instanz eindeutig ist |
ASSET_KEY |
VARCHAR2(4000) |
Datenkatalogassetschlüssel |
|
VARCHAR2(4000) |
Data Catalog-Entityschlüssel |
|
VARCHAR2(4000) |
Data Catalog-Ordnerschlüssel |
ORACLE_TABLE_NAME |
VARCHAR2(128) |
Name der zugeordneten Tabelle |
ORACLE_SCHEMA_NAME |
VARCHAR2(128) |
Name des zugeordneten Schemas |
ENTITY_ORACLE_DB_SCHEMA |
VARCHAR2(4000) |
Benutzerdefinierte Eigenschaft oracle-db-schema der Entity, mit der das Schema abgeleitet wird |
ASSET_ORACLE_DB_SCHEMA |
VARCHAR2(4000) |
Die benutzerdefinierte Eigenschaft oracle-db-schema des Datenassets, mit der das Schema abgeleitet wird |
FOLDER_ORACLE_DB_SCHEMA |
VARCHAR2(4000) |
Die benutzerdefinierte Eigenschaft oracle-db-schema des Ordners, mit der das Schema abgeleitet wird |
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten
DBMS_DCAT$SYNC_LOG-Ansicht
Die Ansicht DBMS_DCAT$SYNC_LOG
bietet einfachen Zugriff auf die Logtabelle für den letzten vom aktuellen Benutzer ausgeführten Synchronisierungsvorgang.
Jeder Aufruf der Prozedur RUN_SYNC
wird in einer neuen Logtabelle protokolliert, auf die das Feld LOGFILE_TABLE
von USER_LOAD_OPERATIONS
verweist. Die Logtabellen werden automatisch nach 2 Tagen gelöscht. Benutzer können alle Synchronisierungslogs mit der Prozedur DELETE_ALL_OPERATIONS löschen, wobei der Typ DCAT_SYNC
lautet.
Die Ansicht DBMS_DCAT$SYNC_LOG
identifiziert automatisch die neueste Logtabelle. Das Schema für die Ansicht DBMS_DCAT$SYNC_LOG
wird unten beschrieben, und die Zugriffsberechtigungen sind mit denen der einzelnen Logtabellen identisch. Standardmäßig wird READ
der Rolle dbms_dcat
und dem Benutzer ADMIN
erteilt.
Die Logtabellen haben das folgende Format:
Spalte | Datentyp | Beschreibung |
---|---|---|
|
TIMESTAMP |
Zeitstempel für den Logeintrag. |
|
VARCHAR2(32) |
Die Eintragslogebene kann einen der folgenden Werte aufweisen: |
LOG_DETAILS |
VARCHAR2(32767) |
Die Lognachricht. |
Übergeordnetes Thema: Zusammenfassung der Datenkatalogansichten