Externe Daten in Oracle Compute Cloud beim Kunden abfragen

Beschreibt Packages und Tools, mit denen autonome KI-Datenbank-Deployments auf Exadata Cloud@Customer unstrukturierte Daten laden, abfragen und verwalten können, indem externe Tabellen und externe partitionierte Tabellen aus Objekten in Data Lakes erstellt werden.

Mit dem Package DBMS_CLOUD können Sie Autonomous AI Database-Deployments auf Exadata Cloud@Customer konfigurieren, um auf die unstrukturierten Daten zuzugreifen, die im Objektspeicher-Bucket von Oracle Compute Cloud at Customer (C3) gespeichert sind.

Überblick

Sie benötigen eine Datenplattform, die Geschäftseinblicke aus strukturierten und unstrukturierten Daten extrahieren kann. Die Kombination aus strukturierten Daten, die in einem Data Warehouse verfügbar sind, und unstrukturierten Daten, die in einem Data Lake verfügbar sind, wird als Data Lakehouse bezeichnet.

Ein Autonomous Data Lakehouse ermöglicht Datenanalysen sowohl für strukturierte als auch für unstrukturierte Daten. Die strukturierten Daten werden in einem Autonomous AI Lakehouse gespeichert, während die unstrukturierten Daten in einem Data Lake gespeichert werden, der in C3 Object Storage-Buckets konfiguriert ist. Das Autonomous AI Lakehouse kann Objekte im Data Lake abfragen, laden und verwalten, indem es ein Datenbankpackage namens DBMS_CLOUD verwendet. Mit diesem Package kann die autonome KI-Datenbank externe und externe partitionierte Tabellen für Data Lake-Objekte wie CSV-, TXT-, Avro- und Parquet-Dateien erstellen. Sie können autonome Data Lakehouses erstellen, indem Sie die Funktionen von Autonomous AI Database-Deployments auf Exadata Cloud@Customer und Oracle C3 kombinieren.

Ein Autonomous Data Lakehouse verfügt über zwei Hauptkomponenten: ein Autonomous AI Lakehouse und einen Data Lake. Das Autonomous AI Lakehouse wird mit Autonomous AI Database-Deployments auf Exadata Cloud@Customer erstellt, während der Data Lake mit C3 Object Storage-Buckets erstellt wird. Die autonome KI-Datenbank hostet die strukturierten relationalen Daten, während der Data Lake Sammlungen unstrukturierter Daten in Form von TXT, CSV, Avro, Parquet und anderen Dateitypen hostet. Sie können die autonome KI-Datenbank abfragen, und die Datenbank bestimmt, wo die Ergebnisse zu finden sind, ob in den strukturierten Daten, den unstrukturierten Daten oder einer Kombination aus beiden. Mit dem Package DBMS_CLOUD können Sie Autonomous AI Database-Deployments auf Exadata Cloud@Customer konfigurieren, um unstrukturierte Daten zu laden, abzufragen und zu verwalten, indem Sie externe und externe partitionierte Tabellen aus Objekten in Data Lakes erstellen.

Voraussetzungen

Führen Sie die folgenden Schritte aus, um C3 Object Storage-Buckets zu konfigurieren und verschiedene Autonomous AI Database-Komponenten bereitzustellen. Sie müssen diese Schritte ausführen, bevor Sie Autonomous AI Database für die Kommunikation mit C3 Object Storage-Buckets konfigurieren.

Erstellen Sie einen C3 Object Storage-Bucket.
Benutzer und Gruppe erstellen. Fügen Sie den Benutzer zur Gruppe hinzu, und konfigurieren Sie die erforderlichen Policys, damit der Benutzer Dateien (Hinzufügen/Lesen/Entfernen) zum Objektspeicher-Bucket C3 verwalten kann.
Beispiel:
```
Allow group <group_name> to manage objects in tenancy where
target.bucket.name='<new_bucket_name_created>'
```
Erstellen Sie einen API-Schlüssel für den erstellten Benutzer. Beachten Sie beim API-Schlüsselgenerierungsprozess die folgenden Informationen: user_ocid, tenancy_ocid, fingerprint, region. Speichern Sie außerdem die öffentlichen und privaten PEM-Schlüsseldateien, die während der API-Schlüsselgenerierung erstellt wurden. Diese Informationen sind erforderlich, um das DBMS_CLOUD-Package später zu konfigurieren.
Laden Sie die https-Certificate Authority-Kette herunter, wie unten gezeigt. Mit dieser Certificate Authority-Kette können Clientanwendungen den Objektspeicher-Bucket C3 über das HTTPS-Protokoll authentifizieren. Die HTTPS-Zertifikate werden in der Regel in einer CRT-Datei gespeichert, z.B. c3_ca.crt. Rufen Sie die Certificate Authority-Kette ab, indem Sie einen Browser auf die folgende URL verweisen: https://iaas.domainname/cachain, wobei domainname der Name der DNS-Domain ist, die während des C3-Infrastruktur-Deployments konfiguriert wurde.
Erstellen Sie eine neue Compute VM. Nachdem die neue VM gestartet wurde, kopieren Sie die private PEM-Schlüsseldatei und die in den obigen Schritten erstellte https-Zertifikatsdatei C3 in die VM.
Exadata-Infrastrukturressource erstellen.
Erstellen Sie ein autonomes VM-Cluster.
Autonome Containerdatenbank (ACD) erstellen.
Autonome KI-Datenbank erstellen

Autonome KI-Datenbank für die Kommunikation mit dem Objektspeicher-Bucket C3 konfigurieren

Sie müssen die folgenden beiden Aufgaben ausführen, damit die autonome KI-Datenbank mit dem Objektspeicher-Bucket C3 kommunizieren kann:

Fügen Sie das C3 Object Storage-HTTPS-Zertifikat zum TCPS-Wallet des autonomen VM-Clusters Grid Infrastructure hinzu. Beispiel: Der Wallet-Speicherort lautet /var/opt/oracle/dbaas_acfs/grid/tcps_wallets. Dies ist erforderlich, damit die autonome KI-Datenbank die HTTPS-Verbindung zu Object Storage C3 authentifizieren kann.
Fügen Sie der Tabelle C##CLOUD$SERVICE_dbms_cloud_store in der oben erstellten ACD einen Eintrag hinzu. Damit teilen Sie dem Package DBMS_CLOUD mit, dass der Objektspeicher-Bucket C3 ein gültiger Cloud-Speicher ist. Beispiel für einen SQL-Befehl:
```
SQL>INSERT INTO C##CLOUD$SERVICE.dbms_cloud_store VALUES('ORACLE_BMC','<objectstorage.mydomain.com>',null,1);
```

In autonomen KI-Datenbanken können Sie die beiden oben genannten Aufgaben nicht als normaler Benutzer ausführen. Oracle Cloud Operations muss diese beiden Aufgaben im Namen des regulären Benutzers ausführen. Um eine neue Supportanfrage für Oracle Cloud Operations zu erstellen, müssen Sie sich bei My Oracle Support (MOS) anmelden, um die beiden Aufgaben ausführen zu können. Sie müssen dem Ticket die folgenden Informationen hinzufügen. Sie erhalten diese Werte, nachdem Sie die Schritte in ausgeführt haben.

OCID der Exadata-Infrastrukturressource
OCID des autonomen VM-Clusters
OCID der ACD
C3 Objektspeicher-URL
C3 Object Storage-HTTPS-Zertifikatsdatei

Nachdem Cloud Operations die oben genannten Aufgaben abgeschlossen hat, melden Sie sich bei der Autonomous AI Database an. Mit der Prozedur DBMS_CLOUD.CREATE_CREDENTIAL können Sie der autonomen KI-Datenbank die Authentifizierungsinformationen bereitstellen, die für die Verbindung mit dem Objektspeicher-Bucket C3 erforderlich sind. Weitere Einzelheiten finden Sie unter CREATE_CREDENTIAL.

Titel und Copyright-Informationen

Oracle und/oder verbundene Unternehmen.