1 Überblick über Oracle AI Data Platform and Workbench

Dieses Kapitel enthält Informationen und Verfahren für neue Benutzer, die mit Oracle AI Data Platform Workbench beginnen.

Wofür wird Oracle AI Data Platform Workbench verwendet?

Oracle AI Data Platform Workbench bietet eine integrierte Umgebung für die Erstellung, Orchestrierung und Operationalisierung von Daten- und KI-Workflows.

Oracle AI Data Platform Workbench ist für Unternehmen konzipiert, die Folgendes tun müssen:
  • Daten-Discovery und -Governance optimieren: AI Data Platform Workbench bietet ein zentrales Metadaten-Repository (Master Catalog), das die Durchsuchbarkeit und Governance von strukturierten und unstrukturierten Daten verbessert.
  • Sichere Datenzusammenarbeit aktivieren: Durch die RBAC-basierte Zugriffskontrolle ermöglicht AI Data Platform Workbench verschiedenen Teams, an gemeinsamen Datasets zu arbeiten und gleichzeitig strenge Sicherheitsrichtlinien einzuhalten.
  • Datenvorbereitung und -verarbeitung beschleunigen: Mit integrierten Notizbüchern und Workfloworchestrierung können Benutzer Daten effizient bereinigen, transformieren und anreichern.
  • Advanced Analytics und KI/ML unterstützen: Die AI Data Platform Workbench lässt sich in Apache Spark integrieren, sodass Data Scientists und Analysten komplexe Berechnungen ausführen und das Modelltraining direkt in ihrem Data Lake ausführen können.
  • Stellen Sie eine nahtlose Integration über Datenquellen hinweg sicher: AI Data Platform Workbench unterstützt externe Kataloge aus Autonomous Database (ADB), Object Storage (OS) und Datenquellen von Drittanbietern, sodass Benutzer Daten ohne Duplizierung abfragen und analysieren können.

Verwaltete Integration mit Open Source

Oracle AI Data Platform Workbench nutzt und erweitert Open-Source-Technologien, um eine leistungsstarke, aber verwaltete Erfahrung zu bieten.

Einige wichtige Integrationen umfassen:
  • Apache Spark: Die Compute-Schicht von AI Data Platform Workbench basiert auf Spark und ermöglicht eine skalierbare, verteilte Datenverarbeitung.
  • Delta Lake-Unterstützung: AI Data Platform Workbench nutzt Delta Lake, um die Datenzuverlässigkeit, ACID-Transaktionen und die Schemaentwicklung zu verbessern.
  • Iceberg- und Hudi-Kompatibilität über Delta Uniform: Durch Delta Uniform erweitert AI Data Platform Workbench die Unterstützung für Apache Iceberg und Apache Hudi und ermöglicht so die Interoperabilität über verschiedene Speicherformate hinweg. Dadurch wird sichergestellt, dass Benutzer eine einheitliche Tabellenformatstrategie anwenden und gleichzeitig eine effiziente Abfrageausführung und Data Governance beibehalten können.
  • JDBC-Integration für BI-Tools: AI Data Platform Workbench bietet JDBC-Treiber, die eine nahtlose Konnektivität mit externen BI-Tools wie Oracle Analytics Cloud (OAC) und Visualisierungsplattformen von Drittanbietern ermöglichen.

Personas für Oracle AI Data Platform-Benutzer

Oracle AI Data Platform bedient eine Vielzahl von Benutzern über verschiedene Rollen in einem Unternehmen hinweg, jede mit individuellen Anforderungen und Anforderungen.

Im Folgenden finden Sie einen allgemeinen Überblick über die wichtigsten Personas, die mit KI-Datenplattformen interagieren:
  • Data Engineers - Data Engineers arbeiten mit großen Datenpipelines und wandeln Rohdaten in verwendbare Formate für Analysen um. Sie verlassen sich auf die robusten Funktionen der AI Data Platform, um Datenworkflows zu entwerfen und zu verwalten, Daten aus verschiedenen Quellen aufzunehmen und die Datenqualität zu gewährleisten. Sie konzentrieren sich stark auf die Automatisierung von Prozessen, die Optimierung von Rechenressourcen und die nahtlose Integration verschiedener Datensysteme.
  • Datenanalysten - Datenanalysten verwenden die AI Data Platform, um Daten zu ermitteln, zu analysieren und Erkenntnisse aus Daten zu generieren. Sie benötigen eine intuitive Benutzeroberfläche und Tools für die Abfrage und Analyse großer Datasets. Mit der AI Data Platform erhalten sie interaktive Notizbücher und eine nahtlose Integration mit Business-Intelligence-(BI-)Tools. So können sie Rohdaten in umsetzbare Erkenntnisse für Entscheidungsträger verwandeln.
  • Data Scientists – Data Scientists nutzen die skalierbaren Rechenfunktionen der AI Data Platform für maschinelles Lernen und erweiterte Analyseaufgaben. Sie benötigen Zugriff auf verschiedene Datensätze, leistungsstarke Verarbeitungstools und die Möglichkeit, komplexe Modelle auszuführen. Die Spark-basierten Notebooks, die KI/ML-Integration und die Unterstützung für Open-Source-Bibliotheken von AI Data Platform ermöglichen es Data Scientists, Modelle innerhalb der Plattform zu erstellen, zu testen und bereitzustellen.
  • Data Stewards - Diese Benutzer stellen sicher, dass alle Daten in Übereinstimmung mit Branchenvorschriften und Organisationsrichtlinien verarbeitet werden. Sie konzentrieren sich auf die Aufrechterhaltung des Datenschutzes, das Auditing des Zugriffs und die Überwachung der Datennutzung im gesamten Unternehmen. Mit AI Data Platform können sie Metadaten verwalten, rollenbasierte Zugriffskontrollen (Role-Based Access Controls, RBAC) durchsetzen und eine ordnungsgemäße Governance durch Katalogisierung, Herkunftsverfolgung und Sicherheitsrichtlinien sicherstellen.

Allgemeine Anwendungsfälle für Oracle AI Data Platform

Oracle AI Data Platform bietet eine Vielzahl von Anwendungsfällen über Branchen und Geschäftsfunktionen hinweg.

Medallion Architektur

  • Implementieren Sie eine Medaillon-Architektur mit Bronze-, Silber- und Goldschichten.
  • Nutzen Sie Delta Uniform und Iceberg für eine effiziente Datenspeicherung und Abfrageoptimierung.
  • Ermöglichen Sie den Zugriff auf externe Datenquellen ohne Kopieren für nahtlose Analysen.

ETL und Data Engineering

  • Verwenden Sie Spark-basierte Workflows und Notizbücher, um Rohdaten zu verarbeiten, zu transformieren und anzureichern.
  • Automatisieren Sie Datenpipelines mit Low-Code-/No-Code-Workfloworchestrierung.
  • Bewältigen Sie die groß angelegte Batch-Verarbeitung und die Datenaufnahme in Echtzeit.

Maschinelles Lernen, KI und Data Science

  • Trainieren und implementieren Sie Modelle für maschinelles Lernen mit Spark-basierten Notebooks.
  • Ermöglichen Sie umfangreiches Feature-Engineering und Datentransformation.
  • Stellen Sie verwaltete Ausführungsumgebungen für Python- und PySpark-Workloads bereit.
KI-Agents mithilfe von Unternehmensdaten erstellen
  • Erstellen Sie dialogorientierte KI-Agents, um das Abrufen und Entwickeln von Daten zu unterstützen.

Enterprise Data Catalog & Governance, Delta Sharing

  • Zentralisierte Metadatenverwaltung für strukturierte und unstrukturierte Daten.
  • Rollenbasierte Zugriffskontrolle (Role-based Access Control, RBAC) für sicheren Datenzugriff und sichere Zusammenarbeit.
  • Integration mit externen Katalogen, einschließlich Autonomous Database (ADB) und Object Storage.
  • Oracle AI Data Platform unterstützt Delta Sharing und ermöglicht einen sicheren Echtzeit- und gesteuerten Datenaustausch über Unternehmensgrenzen hinweg.

Analysen, Business Intelligence und Reporting

  • Verbinden Sie OCI Oracle Analytics Cloud (OAC) und BI-Tools von Drittanbietern über JDBC wie Tableau, Power BI.

Multi-Cloud- und Hybrid-Datenintegration

  • Aktivieren Sie die Ausführung föderierter Abfragen über mehrere OCI-Services hinweg.
  • Integrieren Sie Cloud-Speicher und -Datenbanken von Drittanbietern für hybride Analysen.
  • Verwalten Sie Datensouveränität und Compliance über mehrere Umgebungen hinweg.