Oversikt over analyse med SQL-sluttpunkt for OCI Data Flow

Du bruker Oracle Analytics Cloud når du skal analysere data fra SQL-sluttpunkt for OCI Data Flow i objektlagring, datasjøer og applikasjoner.

SQL-sluttpunkt for Data Flow er utformet for at utviklere, dataforskere og analytikere på avansert nivå skal kunne spørre etter data interaktivt direkte der de befinner seg i en datasjø.

Fordeler med å bruke SQL-sluttpunkt for OCI Data Flow

  • Du kan analysere store volumer av hendelses- og tidsseriedata på stedet for datasjøen uten å måtte flytte og oppsummere dem av ytelseshensyn.
  • Du kan konsolidere data fra flere applikasjoner og datalagre (for eksempel i Enterprise Resource Planning) i objektlagring og utføre ad hoc-spørringer, uavhengig av hvor dataene kommer fra.
  • Du kan klare deg uten uttrekk og forhåndsaggregering, og arbeide med direktedata på alle detaljnivåer. Dermed sparer du tid og krefter ved klargjøring av dataene, og i tillegg har du kraftigere analysefunksjoner.
Anbefalte fremgangsmåter for ytelse


  • Hvis du vil dra nytte av indekseringen og hurtigbufringen på Spark-klyngenivået, oppretter du et datasett basert på én tabell eller visning. Datasett som er basert på sammenføyninger med flere tabeller, støttes, men anbefales ikke.
  • Når du konfigurerer klyngen for SQL-sluttpunkt for OCI Data Flow, setter du incrementalCollect til true. Eksempel:

    spark.sql.thriftServer.incrementalCollect=true;

Visualisere data fra SQL-sluttpunkt for OCI Data Flow

Legg til flere tabeller eller kuber for SQL-sluttpunkt for OCI Data Flow i redigeringsprogrammet for arbeidsbøker for Oracle Analytics Cloud. Når du velger en tabell eller kube, kan du legge til dimensjonskolonner og målingskolonner i datasettene for analyse.