Überblick über die Analyse von OCI Data Flow-SQL-Endpunkten

Sie können Oracle Analytics Cloud verwenden, um Daten aus OCI Data Flow-SQL-Endpunkten in Objektspeichern, Data Lakes und Anwendungen zu analysieren.

Data Flow-SQL-Endpunkte sind für Entwickler, Data Scientists und erfahrene Analysten gedacht, um Daten direkt an ihrem Speicherort in einem Data Lake interaktiv abzufragen.

Vorteile der Verwendung von OCI Data Flow-SQL-Endpunkten

Bei umfangreichen Ereignis- und Zeitreihendaten können Sie In-Place-Analysen im Data Lake durchführen, ohne die Daten aus Performancegründen verschieben und zusammenfassen zu müssen.
Sie können Daten aus mehreren Anwendungen und Datenspeichern (z.B. in Enterprise Resource Planning) im Objektspeicher konsolidieren und unabhängig von der Herkunft der Daten Ad-hoc-Abfragen durchführen.
Auf Extrakte und Voraggregation können Sie verzichten und vielmehr Livedaten mit beliebiger Granularität bearbeiten. Sie reduzieren also nicht nur den Zeit- und Arbeitsaufwand bei der Vorbereitung der Daten, sondern können auch leistungsstärkere Analysefunktionen einsetzen.

Best Practices für Performance

.png

Um die Indexierung und das Caching im Spark-Clustertier zu nutzen, erstellen Sie ein Dataset, das auf einer einzelnen Tabelle oder View basiert. Datasets, die auf Joins mehrerer Tabellen basieren, werden unterstützt, jedoch nicht empfohlen.
Wenn Sie das Cluster der OCI Data Flow-SQL-Endpunkte konfigurieren, setzen Sie incrementalCollect auf "true". Beispiel:
spark.sql.thriftServer.incrementalCollect=true;

Daten aus OCI Data Flow-SQL-Endpunkten visualisieren

Fügen Sie im Oracle Analytics Cloud-Arbeitsmappeneditor mehrere Tabellen oder Cubes aus OCI Data Flow-SQL-Endpunkten hinzu. Wenn Sie eine Tabelle oder einen Cube auswählen, können Sie Ihren Datasets Dimensions- und Kennzahlenspalten zur Analyse hinzufügen.