Tabellen
Tabellen definieren die Struktur Ihrer Daten.
Sie können neue Daten in Ihre Tabellen laden oder an einem vorhandenen Speicherort auf Daten verweisen. Sie können feingranulierte Zugriffskontrollberechtigungen für Tabellen definieren, indem Sie Tabellenberechtigungen erstellen.
Tabellen können entweder extern oder verwaltet werden.
Externe Tabellen
Eine externe Tabelle definiert eine Struktur für Daten, die in einem Speicherort gespeichert sind, der nicht von Oracle AI Data Platform Workbench verwaltet wird. Wenn Sie eine externe Tabelle in AI Data Platform Workbench erstellen, wird der Metadatenlebenszyklus von AI Data Platform Workbench verwaltet. Wenn Sie eine externe Tabelle löschen, wird nur die Tabellendefinition gelöscht. Die von der externen Tabelle referenzierten Daten werden nicht gelöscht.
Stellen Sie sicher, dass Ihre Benutzer über die folgenden IAM-Policys verfügen, die zum Erstellen externer Tabellen erforderlich sind:
allow group <GroupName> to read buckets in compartment id <external-data-CompartmentId>
allow group <GroupName> to inspect objects in compartment id <external-data-CompartmentId>Für externe Tabellen sind zusätzliche IAM-Policys erforderlich. Weitere Informationen finden Sie unter IAM-Policys für Oracle AI Data Platform Workbench.
Verwaltete Tabellen
Eine verwaltete Tabelle definiert eine Struktur für Daten, die in der AI Data Platform gespeichert sind und nur von AI Data Platform Workbench-Benutzern aufgerufen werden können.
Wenn Sie eine verwaltete Tabelle löschen, werden die Tabellendefinition und die Tabellendaten gelöscht.
Unterstützte Tabellenformate
| Formatieren | Beschreibung | Verwendung |
|---|---|---|
| Durch Kommas getrennte Werte (CSV) | Die Daten werden als Textdatei mit einem angegebenen zeilenbasierten Dateiformat gespeichert, um die Daten zu strukturieren. Normalerweise ist die erste Zeile in der Datei eine Kopfzeile, die Spaltennamen für die Daten enthält. | Wird zum Austausch von tabellarischen Daten zwischen Systemen verwendet. Jede Zeile in der Datei ist eine Zeile in einer Tabelle. |
| JavaScript Object Notation (JSON) | Daten werden in einem textbasierten Standardformat gespeichert, um strukturierte Daten basierend auf der JavaScript-Objektsyntax darzustellen. JSON unterstützt Listen mit Objekten oder hierarchischen Strukturen. | Wird in Stream-Anwendungen verwendet. JSON vereinfacht die Speicherung von zugehörigen Daten mit komplexen Beziehungen in einem einzigen Dokument und vermeidet eine chaotische Listenkonvertierung in ein relationales Datenmodell. Beachten Sie, dass JSON nicht teilbar ist. |
| Avro | Daten werden in einem zeilenbasierten Binärformat gespeichert, während das Schema im JSON-Format gespeichert wird, um die Dateigröße zu minimieren und die Effizienz zu maximieren. Avro unterstützt die Schemaentwicklung zuverlässig, indem es hinzugefügte, fehlende und geänderte Felder verwaltet. So kann alte Software neue Daten lesen und neue Software alte Daten lesen. Wird auch als Datenserialisierungssystem bezeichnet. | Wird für die Datenspeicherung verwendet, da Avro-Dateien teilbar und komprimierbar sind. Der serialisierte zeilenbasierte Speicher ist ideal für umfangreiche Schreibtransaktionen, wie das Einfügen von Daten in die AI Data Platform. Avro ist auch eine gute Wahl, wenn die Schemaentwicklung bei Schreibvorgängen mit hoher Geschwindigkeit kritisch ist. |
| Parquet | Die Daten werden in einem spaltenförmigen Datenformat gespeichert und sind hochkomprimierbar und spaltbar. Parkett ist für das Paradigma Write Once Read Many (WORM) optimiert. Es schreibt langsam, liest aber unglaublich schnell, besonders wenn Sie nur auf eine Teilmenge von Spalten zugreifen. | Wird zur Lösung von Big Data-Problemen verwendet, da Komprimierungsalgorithmen mit dem Spaltendatenformat besser funktionieren. Sie können Big Data in verschiedenen Formaten speichern, wie Bildern, Videos, Dokumenten und strukturierten Datentabellen. Parkett ist eine gute Wahl für schwere Arbeitslasten beim Lesen von Datenteilen. Beispiel: Wenn das Dataset viele Spalten enthält, Sie aber nur auf eine Teilmenge von Spalten zugreifen möchten. Ideal, wenn Sie von Spark abhängig sind oder wenn mehrere Services auf dieselben in Object Storage gespeicherten Daten zugreifen sollen. |
| Optimierte Zeilenspalte (ORC) | Daten werden in Zusammenstellungen von Zeilen in einer einzelnen Datei im Spaltenformat gespeichert. | Wird für die parallele Verarbeitung von Zeilen-Collections in einem Cluster verwendet. Ideal, wenn Lesetransaktionen mehr sind als Schreibtransaktionen oder wenn die Komprimierung Priorität hat. |
| Delta | Daten werden in einem spaltenförmigen Format gespeichert, das Parquet-Datendateien um ein JSON-dateibasiertes Transaktionslog für ACID-Transaktionen und skalierbare Metadatenbehandlung erweitert. | Wird für die Transaktionsunterstützung verwendet. |
Einschränkungen
Die folgenden Einschränkungen gelten für Tabellen in Oracle AI Data Platform:
- Sie können keine externe Tabelle für Datendateien oder Verzeichnisse in/auf einem Volume definieren.
- Sie können keine externe Tabelle in einem Bucket und/oder seinem Verzeichnis definieren, das bereits für eine andere externe Tabelle oder ein externes Volume verwendet wird
- Ansichten können nicht im Masterkatalog angezeigt/gelistet werden.
Externe Tabelle erstellen
Sie können eine externe Tabelle mit Daten in OCI Object Storage erstellen.
Tabellen bearbeiten
Sie können die Details der von Ihnen verwalteten Tabellen ändern.
- Navigieren Sie zu Ihrem Schema.
- Wählen Sie die Registerkarte Tabellen aus.
- Klicken Sie neben der Tabelle, die Sie bearbeiten möchten, auf
Aktionen.- Klicken Sie auf Umbenennen, um den Namen der Tabelle zu ändern. Geben Sie einen neuen Namen ein, und drücken Sie die Eingabetaste.
- Klicken Sie auf Beschreibung bearbeiten, um die Beschreibung der Tabelle zu ändern. Geben Sie die neue Beschreibung an, und klicken Sie auf Speichern.
Tabellen-Details anzeigen
Sie können die Details von Tabellen im Schema anzeigen.
- Navigieren Sie zu Ihrem Schema. Klicken Sie auf die Registerkarte Tabellen.
- Klicken Sie auf den Namen des Volumes, für das Sie Details anzeigen möchten. Sie können auch auf
Aktionen neben dem Volume klicken und dann auf Anzeigen klicken. - Klicken Sie auf die Registerkarte Details.
Tabellen löschen
Sie können Tabellen aus dem von Ihnen verwalteten Schema löschen.
- Navigieren Sie zu dem Schema, aus dem Sie die Tabelle löschen möchten.
- Klicken Sie auf die Registerkarte Tabellen.
- Klicken Sie neben der zu löschenden Tabelle auf
Aktionen, und klicken Sie auf Löschen. - Klicken Sie auf Löschen.

