Überblick über die Analyse von OCI Data Flow-SQL-Endpunkten

Sie können Oracle Analytics Cloud verwenden, um Daten aus OCI Data Flow-SQL-Endpunkten in Objektspeichern, Data Lakes und Anwendungen zu analysieren.

Data Flow-SQL-Endpunkte sind für Entwickler, Data Scientists und erfahrene Analysten gedacht, um Daten direkt an ihrem Speicherort in einem Data Lake interaktiv abzufragen.

Vorteile der Verwendung von OCI Data Flow-SQL-Endpunkten

  • Bei umfangreichen Ereignis- und Zeitreihendaten können Sie In-Place-Analysen im Data Lake durchführen, ohne die Daten aus Performancegründen verschieben und zusammenfassen zu müssen.
  • Sie können Daten aus mehreren Anwendungen und Datenspeichern (z.B. in Enterprise Resource Planning) im Objektspeicher konsolidieren und unabhängig von der Herkunft der Daten Ad-hoc-Abfragen durchführen.
  • Auf Extrakte und Voraggregation können Sie verzichten und vielmehr Livedaten mit beliebiger Granularität bearbeiten. Sie reduzieren also nicht nur den Zeit- und Arbeitsaufwand bei der Vorbereitung der Daten, sondern können auch leistungsstärkere Analysefunktionen einsetzen.
Best Practices für Performance


  • Um die Indexierung und das Caching im Spark-Clustertier zu nutzen, erstellen Sie ein Dataset, das auf einer einzelnen Tabelle oder View basiert. Datasets, die auf Joins mehrerer Tabellen basieren, werden unterstützt, jedoch nicht empfohlen.
  • Wenn Sie das Cluster der OCI Data Flow-SQL-Endpunkte konfigurieren, setzen Sie incrementalCollect auf "true". Beispiel:

    spark.sql.thriftServer.incrementalCollect=true;

Daten aus OCI Data Flow-SQL-Endpunkten visualisieren

Fügen Sie im Oracle Analytics Cloud-Arbeitsmappeneditor mehrere Tabellen oder Cubes aus OCI Data Flow-SQL-Endpunkten hinzu. Wenn Sie eine Tabelle oder einen Cube auswählen, können Sie Ihren Datasets Dimensions- und Kennzahlspalten zur Analyse hinzufügen.