Oversikt over analyse med SQL-sluttpunkt for OCI Data Flow

Du bruker Oracle Analytics Cloud når du skal analysere data fra SQL-sluttpunkt for OCI Data Flow i objektlagring, datasjøer og applikasjoner.

SQL-sluttpunkt for Data Flow er utformet for at utviklere, dataforskere og analytikere på avansert nivå skal kunne spørre etter data interaktivt direkte der de befinner seg i en datasjø.

Fordeler med å bruke SQL-sluttpunkt for OCI Data Flow

Du kan analysere store volumer av hendelses- og tidsseriedata på stedet for datasjøen uten å måtte flytte og oppsummere dem av ytelseshensyn.
Du kan konsolidere data fra flere applikasjoner og datalagre (for eksempel i Enterprise Resource Planning) i objektlagring og utføre ad hoc-spørringer, uavhengig av hvor dataene kommer fra.
Du kan klare deg uten uttrekk og forhåndsaggregering, og arbeide med direktedata på alle detaljnivåer. Dermed sparer du tid og krefter ved klargjøring av dataene, og i tillegg har du kraftigere analysefunksjoner.

Anbefalte fremgangsmåter for ytelse

.png

Hvis du vil dra nytte av indekseringen og hurtigbufringen på Spark-klyngenivået, oppretter du et datasett basert på én tabell eller visning. Datasett som er basert på sammenføyninger med flere tabeller, støttes, men anbefales ikke.
Når du konfigurerer klyngen for SQL-sluttpunkt for OCI Data Flow, setter du incrementalCollect til true. Eksempel:
spark.sql.thriftServer.incrementalCollect=true;

Visualisere data fra SQL-sluttpunkt for OCI Data Flow

Legg til flere tabeller eller kuber for SQL-sluttpunkt for OCI Data Flow i redigeringsprogrammet for arbeidsbøker for Oracle Analytics Cloud. Når du velger en tabell eller kube, kan du legge til dimensjonskolonner og målingskolonner i datasettene for analyse.