3 Funktionen von Oracle AI Data Platform Workbench
Oracle AI Data Platform Workbench ist eine moderne Datenplattform, die darauf ausgelegt ist, die Datenaufnahme, -verarbeitung und -analyse in großem Maßstab zu vereinfachen. Es bietet eine nahtlose Integration von Rechen-, Speicher- und Katalogisierungsfunktionen, um eine effiziente Datenverwaltung zu ermöglichen.
Zu den wichtigsten Features von AI Data Platform Workbench gehören:
Workspace
Ein Workspace in AI Data Platform Workbench fungiert als isolierte Umgebung, in der Benutzer ihre Data Lake-Ressourcen verwalten und organisieren können, einschließlich Workflows, Notizbücher und Bibliotheken. Workspaces ermöglichen eine effiziente Zusammenarbeit und Governance, indem Ressourcen logisch gruppiert werden.
Berechnen
AI Data Platform Workbench bietet skalierbare CPU- und GPU-Compute-Ressourcen für die Ausführung von Datenverarbeitungs- und Analyse-Workloads. Benutzer können Spark-basierte Ausführungsumgebungen für eine leistungsstarke Verarbeitung nutzen und Batch- und interaktive Workloads unterstützen.
Notizbuch
AI Data Platform Workbench umfasst Notizbücher als interaktive Entwicklungsumgebung zum Schreiben und Ausführen von Code. Sie unterstützt Python und SparkSQL, sodass Benutzer Daten direkt in der AI Data Platform transformieren, analysieren und visualisieren können.
Workflow
Mit der Workflowkomponente können Benutzer Datenpipelines aus Notizbüchern, Python-Aufgaben, If-else-Aufgaben und anderen Jobaufgaben definieren und orchestrieren. Benutzer können Workflows für ETL, Datentransformationen und Analyseautomatisierung erstellen, planen und überwachen.
Hauptkatalog
Der Master-Katalog dient als zentrales Metadaten-Repository für alle strukturierten und unstrukturierten Datasets in einer AI Data Platform Workbench. Es bietet einheitliche Governance und Datenerkennung, sodass Benutzer Datasets über verschiedene Schemas und Speicherorte hinweg suchen und verwalten können.
Katalog
Ein Katalog in einer AI Data Platform Workbench ist eine logische Gruppierung von Schemas, Tabellen, Volumes und Modellen, die eine strukturierte Möglichkeit zum Organisieren von Datasets bietet. Benutzer können mehrere Kataloge für verschiedene Projekte oder Teams erstellen, um eine effektive Datensegmentierung sicherzustellen.
Schema
Ein Schema definiert die Struktur in einem Katalog und organisiert Tabellen und Views unter einem gemeinsamen Namespace. Schemas helfen bei der logischen Strukturierung von Daten für verschiedene Anwendungen und Analyse-Workloads.
Tabelle
Eine Tabelle in einer AI Data Platform Workbench stellt strukturierte Datasets dar, die abgefragt und verarbeitet werden können. Tabellen unterstützen verschiedene Speicherformate, einschließlich Delta Uniform, um die Kompatibilität mit mehreren Abfrage-Engines sicherzustellen.
Anzeigen
Eine View ist eine virtuelle Tabelle in einer AI Data Platform Workbench, die eine abfragbare Darstellung von Daten bereitstellt, die in zugrunde liegenden Tabellen gespeichert sind. Ansichten ermöglichen einen vereinfachten Zugriff auf transformierte Datasets, ohne dass Daten dupliziert werden müssen.
Volume
Ein Volume ist eine Speicherabstraktion in einer AI Data Platform Workbench, die einen verwalteten Speicherplatz für das Persistieren von Raw-, Verarbeitungs- und kuratierten Daten bereitstellt. Sie unterstützt den effizienten Datenzugriff und die Integration mit Object Storage.
Automatisch ausfüllen
Das Feature "Automatisch auffüllen" vereinfacht die Metadatenverwaltung, indem neue Datasets in OCI Object Storage automatisch erkannt und registriert werden. Dadurch wird der manuelle Aufwand bei der Aktualisierung von Datenkatalogen reduziert.
Rollenbasierte Zugriffskontrollen (Role-Based Access Controls (RBAC))
AI Data Platform implementiert RBAC, um eine feingranulierte Zugriffskontrolle über verschiedene Ressourcen hinweg durchzusetzen. Benutzer können Rollen und Berechtigungen für Workspaces, Kataloge und Datasets definieren, um eine sichere Zusammenarbeit sicherzustellen.
Auditlog
Auditlogs in Oracle AI Data Platform Workbench erfassen detaillierte Datensätze zu Benutzeraktivitäten. Mit diesen Logs können Sie die Nutzung überwachen, die Compliance sicherstellen und Probleme wie unbefugten Zugriff oder Konfigurationsänderungen untersuchen.
Dreiteiliger Namespace
AI Data Platform Workbench verwendet einen dreiteiligen Namespace (Catalog.Schema.Table) für den Zugriff auf Datasets, sodass Daten plattformübergreifend strukturiert und konsistent referenziert werden können. Diese Standardisierung verbessert die Interoperabilität und den einfachen Zugriff.