Data Lake mit Autonomous Database verwenden
Lernen Sie die Vorteile von Data Lake mit Autonomous Database kennen.
- Data Lake mit Autonomous Database
Oracle Autonomous Database ist eine vielseitige Lösung für alle Arten von Daten und Workloads. - Was ist ein Data Lake?
Data Lakes sind zentralisierte Repositorys, die große Mengen an Rohdaten in ihrem nativen Format speichern, bis die Daten für die Analyse benötigt werden. - Wichtige Data Lake-Features von Autonomous Database
Oracle Autonomous Database wurde entwickelt, um Data Lake-Workloads nahtlos zu unterstützen, sodass keine Verwaltung oder Installation erforderlich ist. Sie bietet robuste Funktionen für die Verarbeitung verschiedener Datenformate in verschiedenen Cloud-Umgebungen und stellt so eine flexible und umfassende Datenanalyse sicher.
Übergeordnetes Thema: Features
Data Lake mit Autonomous Database
Oracle Autonomous Database ist eine vielseitige Lösung für alle Arten von Daten und Workloads.
Autonomous Database bietet kosteneffizienten Speicher, wobei die Kosten pro TB mit den Objektspeichern vergleichbar sind, und unterstützt gleichzeitig verschiedene Datentypen wie JSON, Graph und Vector. Mit Autonomous Database können Unternehmen ihre Daten auf einer einzigen Plattform konsolidieren. Sie können konvergente Funktionen wie Oracle Machine Learning (OML), Graph, Spatial, Vector und Blockchain nutzen, um ihre Daten umfassend zu verwalten.
Für Unternehmen, die bereits über vorhandene Data Lakes auf anderen Plattformen verfügen, lässt sich Oracle Autonomous Database nahtlos integrieren, sodass Unternehmen von den erweiterten Features von Autonomous Database profitieren können, ohne ihre aktuellen Setups zu unterbrechen.
Weitere Informationen finden Sie unter LiveLabs Data Lake mit Autonomous Data Warehouse erstellen.
Übergeordnetes Thema: Data Lake mit Autonomous Database verwenden
Was ist ein Data Lake?
Data Lakes sind zentrale Repositorys, in denen große Mengen an Rohdaten in ihrem nativen Format gespeichert werden, bis die Daten für die Analyse benötigt werden.
Sie sind hochflexibel und skalierbar und bieten eine leistungsstarke Ergänzung zu herkömmlichen Data Warehouses, indem sie Unternehmen die Möglichkeit bieten, verschiedene Arten von Daten zu speichern und zu verarbeiten, einschließlich strukturierter, halbstrukturierter und unstrukturierter Daten.
-
Datei- und Tabellenformate öffnen
Data Lakes speichern Daten in offenen Dateiformaten wie CSV, Parquet und Tabellenformaten wie Iceberg. Dies gewährleistet Interoperabilität und Flexibilität bei der Datenverarbeitung, da mehrere Engines diese Datensätze schreiben und lesen können.
-
Unterstützung für mehrere Datenverarbeitungs-Engines
Data Lakes sind mit verschiedenen Datenverarbeitungs-Engines wie Apache Spark, Presto und Hive kompatibel und ermöglichen so verschiedene analytische Workloads.
-
Schema-on-Read
Data Lakes verwenden häufig einen Schema-on-Read-Ansatz, was bedeutet, dass kein Schema im Voraus definiert werden muss. Dies ermöglicht eine schnelle Datenaufnahme, bei der Daten ohne vorherige Strukturierung geladen werden können, ähnlich wie Objektspeicher, die "Daten jetzt erfassen und später Fragen stellen".
-
Unterstützung für unstrukturierte Daten
Über strukturierte Daten hinaus können Data Lakes unstrukturierte Daten wie Bilder (JPG), Dokumente (PDF, Word) und andere Binärdaten speichern und bieten eine umfassende Speicherlösung.
Übergeordnetes Thema: Data Lake mit Autonomous Database verwenden
Wichtige Data Lake-Features von Autonomous Database
Oracle Autonomous Database wurde entwickelt, um Data Lake-Workloads nahtlos zu unterstützen, sodass keine Verwaltung oder Installation erforderlich ist. Sie bietet robuste Funktionen für die Verarbeitung verschiedener Datenformate in verschiedenen Cloud-Umgebungen und stellt so eine flexible und umfassende Datenanalyse sicher.
- Bereit für Data Lake-Workloads
Oracle Autonomous Database ist sofort einsatzbereit und erfordert keine zusätzlichen Komponenten. Diese Bereitschaft erstreckt sich auf wichtige Data Lake-Aufgaben wie die Datentransformation, das Metadatenmanagement und die Integration mit gängigen Data Lake-Tools – und das alles vom ersten Tag an ohne zusätzliches Setup. - Multi-Cloud Support
Für Unternehmen, die bereits über vorhandene Data Lakes auf anderen Plattformen verfügen, lässt sich Autonomous Database nahtlos integrieren, sodass Unternehmen von den erweiterten Features von Autonomous Database profitieren können, ohne ihre aktuellen Setups zu unterbrechen. - End-to-End-Unterstützung für Datenformate
Oracle Autonomous Database wurde mit der Flexibilität entwickelt, ein breites Spektrum an Datenformaten zu verarbeiten, was es zu einer universellen Lösung für verschiedene Datenquellen und Workloads macht. - Erweiterte Funktionen: Autonomous Database für unstrukturiertes Datenmanagement
Während Oracle Database für seine leistungsstarke Verarbeitung strukturierter und halbstrukturierter Daten bekannt ist, erweitert Autonomous Database seine Funktionen für die Verarbeitung unstrukturierter Datasets. - Flexible Metadatenverwaltung
Oracle Autonomous Database bietet Benutzern verschiedene Möglichkeiten, Metadaten für ihre Datasets zu definieren, sodass die Datenverwaltung anpassungsfähiger und effizienter wird. - Unterstützung von föderierten Metadaten
Autonomous Database unterstützt einen föderierten Metadatenkatalog, mit dem Benutzer Metadaten aus verschiedenen Quellen in einer einzigen Ansicht vereinheitlichen können, sodass eine einheitliche Schnittstelle für die Metadatenverwaltung bereitgestellt wird. - Zusammenarbeit
Nachdem Benutzer ihre Analyse abgeschlossen haben, müssen sie ihre Ergebnisse häufig mit anderen teilen. Oracle Autonomous Database vereinfacht die gemeinsame Nutzung, indem es verschiedene Möglichkeiten zur Zusammenarbeit bietet und einzigartige Vorteile gegenüber anderen Datenbanken bietet, wie integrierte Sicherheitsfunktionen, offene Protokolle und nahtlose Cloud-Konnektivität. - Große Kompatibilität mit Oracle Database-Tools
Die Autonomous Database-Umgebung ist vollständig mit einer Vielzahl von Oracle-Datenbanktools kompatibel.
Übergeordnetes Thema: Data Lake mit Autonomous Database verwenden
Bereit für Data Lake-Workloads
Oracle Autonomous Database ist sofort einsatzbereit und erfordert keine zusätzlichen Komponenten. Diese Bereitschaft erstreckt sich auf wichtige Data Lake-Aufgaben wie die Datentransformation, das Metadatenmanagement und die Integration mit gängigen Data Lake-Tools – und das alles vom ersten Tag an ohne zusätzliches Setup.
Diese umfassende Bereitschaft zeichnet Autonomous Database aus und bietet ein integriertes, problemloses Erlebnis, das die Zeit bis zur Einsicht für Data Lake-Workloads beschleunigt. Das bedeutet, dass Benutzer sofort mit der Verarbeitung von Data Lake-Aufgaben ohne Setup oder Konfiguration beginnen können, was sie zu einer echten Plug-and-Play-Lösung für Data Lake-Umgebungen macht. Diese integrierte Funktion vereinfacht den Betrieb, senkt die Wartungskosten und sorgt für eine höhere Zuverlässigkeit bei weniger Fehlern.
Autonomous Database bietet eine Reihe von Tools für alle Benutzertypen, von Entwicklern bis hin zu Business Analysts, sodass die Plattform universell und zugänglich ist.
Entwickler können Tools wie die PL/SQL-API für erweiterte Vorgänge, Skripting und Automatisierung verwenden, um eine nahtlose Integration mit vorhandenen Tools zu ermöglichen und benutzerdefinierte Datenbanklösungen effizient zu erstellen. Weitere Informationen finden Sie unter Von Autonomous Database bereitgestelltes Package - Referenz.
Für Geschäftsanwender kann Data Studio verwendet werden – eine webbasierte Oberfläche zur Vereinfachung der Dateninteraktion, -exploration und -visualisierung. Data Studio ermöglicht es nicht-technischen Benutzern, Erkenntnisse abzuleiten, Berichte zu erstellen und effektiv zusammenzuarbeiten, die Komplexität zu reduzieren und fundierte Entscheidungen zu unterstützen. Weitere Informationen finden Sie unter Überblickseite von Data Studio.
Übergeordnetes Thema: Key Data Lake-Features von Autonomous Database
Multi-Cloud Support
Für Unternehmen, die bereits über vorhandene Data Lakes auf anderen Plattformen verfügen, lässt sich Autonomous Database nahtlos integrieren, sodass Unternehmen von den erweiterten Features von Autonomous Database profitieren können, ohne ihre aktuellen Setups zu unterbrechen.
Gewähren Sie Autonomous Database Zugriff auf Ihren Data Lake, indem Sie die erforderlichen Berechtigungen und den Zugriff für die Verbindung Ihres Data Lakes mit Autonomous Database erteilen. Nachdem Sie die erforderlichen Zugangsdaten bereitgestellt haben, kann Autonomous Database nahtlos eine Verbindung zu Data Lakes in verschiedenen Cloud-Umgebungen herstellen, einschließlich AWS, Azure, Google Cloud und Oracle OCI-Objektspeicher.
Mit dieser Funktion können Sie sicher auf Ihre Daten zugreifen und diese verwalten und die nativen Sicherheitsfunktionen jedes Cloud-Providers nutzen. Mit diesem Multi-Cloud-Support erhalten Sie die Flexibilität, Ihren Data Lake auf verschiedenen Cloud-Plattformen bereitzustellen und zu skalieren und gleichzeitig eine einheitliche und sichere Umgebung zu erhalten.
Oracle Autonomous Database unterstützt native Sicherheit für andere Clouds. Weitere Informationen finden Sie unter Amazon-Ressourcennamen (ARNs) für den Zugriff auf AWS-Ressourcen verwenden, Azure-Service-Principal für den Zugriff auf Azure-Ressourcen verwenden und Google-Serviceaccount für den Zugriff auf Google Cloud-Plattformressourcen verwenden für Ihre entsprechende Cloud-Plattform.
Übergeordnetes Thema: Key Data Lake-Features von Autonomous Database
Unterstützung für End-to-End-Datenformate
Oracle Autonomous Database wurde mit der Flexibilität entwickelt, ein breites Spektrum an Datenformaten zu verarbeiten, sodass es eine universelle Lösung für verschiedene Datenquellen und Workloads ist.
Unabhängig davon, ob sich Ihre Daten in strukturierten, halbstrukturierten oder unstrukturierten Formaten befinden, unterstützt Autonomous Database sie nahtlos über verschiedene Cloud-Umgebungen hinweg. Auf diese Weise können Unternehmen Daten aufnehmen, speichern und analysieren, ohne sich Gedanken über die Formatkompatibilität machen zu müssen.
Autonomous Database bietet native Unterstützung für traditionelle Formate wie CSV und JSON sowie für erweiterte Formate wie AVRO, Parquet und ORC. Weitere Informationen finden Sie unter Externe Daten mit Autonomous Database abfragen. Autonomous Database unterstützt die folgenden Dateiformate: CSV, JSON, XML, AVRO, ORC, Parquet, Delta Sharing, Iceberg, Word, PDF.
Mit der zusätzlichen Unterstützung für das Iceberg-Tabellenformat bietet Autonomous Database erweiterte Funktionen für große Data Lake-Umgebungen. Iceberg ermöglicht optimierte, leistungsstarke Abfragen, eine bessere Versionskontrolle und ein einfacheres Datenmanagement und eignet sich somit gut für große, sich entwickelnde Datensätze. Weitere Informationen finden Sie unter Apache Iceberg-Tabellen abfragen.
Übergeordnetes Thema: Key Data Lake-Features von Autonomous Database
Erweiterte Funktionen: Autonomous Database für unstrukturiertes Datenmanagement
Während Oracle Database für seine leistungsstarke Verarbeitung strukturierter und halbstrukturierter Daten bekannt ist, erweitert Autonomous Database seine Funktionen für die Verarbeitung unstrukturierter Datasets.
- KI-gesteuerte Einblicke mit Retrieval Augmented Generation (RAG): Autonomous Database integriert erweiterte KI-Modelle und ermöglicht Vector Search für unstrukturierte Daten. Dies ermöglicht das effiziente Abrufen relevanter Informationen über riesige Datasets hinweg mithilfe von KI und verbessert die Suchgenauigkeit und -geschwindigkeit. Weitere Informationen finden Sie unter AI mit Retrieval Augmented Generation (RAG) auswählen.
- Volltextindizierung: Autonomous Database unterstützt die Erstellung von Volltextindizes für unstrukturierte Dateien, sodass erweiterte Textsuchen für Dokumente wie PDFs, Word-Dateien usw. durchgeführt werden können. Diese Funktion verbessert erheblich, wie unstrukturierte Inhalte abgefragt, indexiert und analysiert werden können. Siehe Volltextsuche für Dateien in Object Storage verwenden
- Unstrukturierte Daten parsen und laden: Mit den erweiterten Parsing- und Datenaufnahmefeatures von Autonomous Database können Benutzer unstrukturierte Daten nahtlos laden und automatisch in ein tabellarisches Format transformieren, das zum Laden in die Datenbank bereit ist. Weitere Informationen finden Sie unter Tabellenextraktion aus Bild ausführen.
- KI als Datenquelle (Prompt-to-Table): Autonomous Database nutzt KI und ermöglicht die Prompt-to-Table-Funktionalität, mit der Benutzer Daten direkt aus KI-Modellen generieren und in Tabellen laden können. Dies eröffnet Möglichkeiten, wertvolle Erkenntnisse aus KI-generierten Ausgaben zu extrahieren und als neue Quelle für strukturierte Daten zu nutzen. Siehe Daten aus AI-Quelle laden
Diese erweiterten Funktionen positionieren Autonomous Database als leistungsstarkes Tool zur Bewältigung der wachsenden Anforderungen unstrukturierter Daten und nutzen gleichzeitig KI-gestützte Lösungen, was es zu einer vielseitigen und zukunftssicheren Plattform für moderne Datenherausforderungen macht.
Übergeordnetes Thema: Key Data Lake-Features von Autonomous Database
Flexible Metadatenverwaltung
Oracle Autonomous Database bietet Benutzern verschiedene Möglichkeiten, Metadaten für ihre Datasets zu definieren, sodass die Datenverwaltung anpassungsfähiger und effizienter wird.
- Katalogbasierte Metadatenintegration
Benutzer können Metadaten aus verschiedenen Katalogen in eine zentrale Ansicht integrieren, sodass die Datenkonsistenz im gesamten Unternehmen einfacher kontrolliert und verwaltet werden kann. Folgende Kataloge werden unterstützt:
-
OCI Data Catalog: Ein Tool in Oracle Cloud Infrastructure (OCI), mit dem Benutzer Datenassets erkennen, organisieren und verwalten können. Sie bietet einen klaren Überblick über alle Datenassets und unterstützt Benutzer dabei, die Compliance aufrechtzuerhalten, die Datenqualität sicherzustellen und die teamübergreifende Zusammenarbeit zu erleichtern. Weitere Informationen finden Sie unter Beispiel: Szenario MovieStream.
-
AWS Glue: Ein verwalteter ETL-Service (Extrahieren, Transformieren, Laden) von Amazon Web Services, der einen Datenkatalog zum Organisieren und Verwalten von Metadaten enthält. Weitere Informationen finden Sie unter Externe Daten mit AWS Glue Data Catalog abfragen.
-
- Manuelle Metadatendefinition
Benutzer können Metadaten auch direkt auf Tabellenebene für Datasets in Objektspeichern wie Oracle Cloud Infrastructure (OCI) Object Storage oder Amazon S3 definieren. Dies ermöglicht eine maßgeschneiderte Organisation von Daten für einzelne Dateien oder Gruppen von Dateien, die auf die Benutzeranforderungen zugeschnitten sind. Autonomous Database kann auch automatisch Metadaten wie Spaltennamen und Datentypen ableiten, um Zeit zu sparen und Fehler zu reduzieren. Beispiel: Beim Hochladen einer CSV-Datei kann das System Header automatisch als Spaltennamen erkennen und entsprechende Datentypen wie Zahl oder varchar2 basierend auf dem Inhalt zuweisen. Dadurch können Benutzer ihre Daten ohne manuelle Eingriffe schnell für die Analyse vorbereiten, die Einrichtungszeit reduzieren und die Fehlerwahrscheinlichkeit minimieren.
Übergeordnetes Thema: Key Data Lake-Features von Autonomous Database
Unterstützung für föderierte Metadaten
Autonomous Database unterstützt einen föderierten Metadatenkatalog, mit dem Benutzer Metadaten aus verschiedenen Quellen in einer einzigen Ansicht vereinheitlichen und eine einheitliche Schnittstelle für die Metadatenverwaltung bereitstellen können.
Dieser Ansatz vereinfacht die Metadatenverwaltung über verschiedene Umgebungen hinweg, indem Datenquellen über mehrere Clouds und Plattformen hinweg verbunden werden. Unabhängig davon, ob Sie katalogbasierte Metadaten verwenden oder diese manuell definieren, stehen alle Informationen in einem einheitlichen Katalog zur einfachen Suche zur Verfügung. Beispiel: Ein Unternehmen kann diese föderierte Ansicht verwenden, um Datenassets aus AWS und Oracle Cloud zu verwalten und so eine konsistente Governance und Auffindbarkeit über Plattformen hinweg sicherzustellen.
Übergeordnetes Thema: Key Data Lake-Features von Autonomous Database
Collaboration
Nachdem Benutzer ihre Analyse abgeschlossen haben, müssen sie ihre Ergebnisse oft mit anderen teilen. Oracle Autonomous Database vereinfacht die gemeinsame Nutzung, indem es verschiedene Möglichkeiten zur Zusammenarbeit bietet und einzigartige Vorteile gegenüber anderen Datenbanken bietet, wie integrierte Sicherheitsfunktionen, offene Protokolle und nahtlose Cloud-Konnektivität.
Diese Optionen sind flexibel und sicher, sodass sie unterschiedlichen Anforderungen an die Zusammenarbeit entsprechen:
-
Delta-Sharing-Protokoll: Damit können Sie Daten außerhalb von Oracle mit dem offenen Protokoll Delta-Sharing teilen. Es unterstützt den sicheren Datenaustausch mit externen Partnern, ohne dass eine komplexe Integration erforderlich ist, und eignet sich somit ideal für cloud-übergreifende und plattformübergreifende Analysen. Auf diese Weise können Daten problemlos in verschiedenen Analysetools verwendet werden, die nicht zu Oracle gehören. Weitere Informationen finden Sie unter Datenversionen mit Object Storage gemeinsam verwenden.
-
Cloud-Links: Sie können Daten über sichere Cloud-Links zwischen verschiedenen Autonomous Database-Instanzen freigeben. Cloud-Links sind beispielsweise besonders effektiv für die Verbindung verschiedener Datenbanken. Dies gewährleistet eine konsistente Datenverfügbarkeit und reduziert die Latenz für Anwendungen, die einen schnellen und zuverlässigen Zugriff auf Daten über mehrere Datenbanken hinweg benötigen, ohne dass sie kopiert oder dupliziert werden müssen. Es sorgt für eine reibungslose Zusammenarbeit für Teams, die verteilt sind und zusammenarbeiten müssen. Siehe Livedaten über direkte Verbindung freigeben
-
Tabellen-Hyperlinks: Sie können Daten direkt freigeben, indem Sie spezielle URLs erstellen, die den Zugriff auf die Daten ermöglichen, ohne dass eine separate Anmeldung erforderlich ist. Benutzer können die Berechtigungen steuern und Ablaufzeiten für diese URLs festlegen, um sichere und flexible Freigabeoptionen sicherzustellen. Dieses Feature wurde speziell für REST-Clients entwickelt. Weitere Informationen finden Sie unter Tabellen-Hyperlink für eine Tabelle oder Ansicht generieren.
Übergeordnetes Thema: Key Data Lake-Features von Autonomous Database
Breite Kompatibilität mit Oracle Database-Tools
Die Autonomous Database-Umgebung ist vollständig mit einer Vielzahl von Oracle-Datenbanktools kompatibel.
Jedes Tool, das Sie bereits für die Interaktion mit Oracle Datenbanken verwenden – ob für Datenvisualisierung, Analysen, ETL oder Administration – kann auch nahtlos genutzt werden, um Datasets in Autonomous Database zu analysieren. Diese Kompatibilität gewährleistet eine reibungslose Benutzererfahrung, sodass Benutzer Autonomous Database in ihre vorhandenen Workflows integrieren können, ohne neue Tools oder Prozesse einführen zu müssen. Dadurch wird die Effizienz maximiert und die Lernkurve reduziert.
Informationen zu einigen der Tools, die für die Verwendung mit Oracle-Datenbanken verfügbar sind, finden Sie unter Überblicksseite von Data Studio.
Übergeordnetes Thema: Key Data Lake-Features von Autonomous Database