Oversigt over analyse af SQL-slutpunkter for OCI Data Flow

Du bruger Oracle Analytics Cloud til at analysere data fra OCI Data Flow SQL-slutpunkter i objektlagring, datasøer og applikationer.

SQL-slutpunkter for Data Flow er designet til udviklere, dataeksperter og analytikere, der arbejder med avanceret analyse, så de interaktivt kan forespørge data, direkte hvor de er placeret i en datasø.

Fordele ved at bruge SQL-slutpunkter for OCI Data Flow

Du kan analysere store mængder begivenheds- og tidsseriedata på stedet i datasøen uden at skulle flytte og opsummere dem af hensyn til ydeevnen.
Du kan konsolidere data fra flere applikationer og datalagre (for eksempel i Enterprise Resource Planning) i Object Storage og udføre ad hoc-forespørgsler, uanset hvor dataene stammer fra.
Du slipper for at oprette udtræk og aggregere på forhånd og kan arbejde på livedata på et hvilket som helst detaljeringsniveau. Det betyder, at du ikke alene sparer tid og kræfter, når du forbereder dataene, du har også mere effektive analysefunktioner.

Bedste praksis for ydeevne

.png

Hvis du vil drage fordel af indeksering og caching på Spark-klyngeniveauet, skal du oprette et datasæt på basis af en enkelt tabel eller visning. Datasæt, der er baseret på sammenkædninger af flere tabeller, understøttes, men anbefales ikke.
Når du konfigurerer klyngen af OCI Data Flow SQL-slutpunkter, skal du sætte incrementalCollect til sand, f.eks:
spark.sql.thriftServer.incrementalCollect=true;

Visualisere data fra SQL-slutpunkter for OCI Data Flow

Tilføj flere tabeller eller kuber fra SQL-slutpunkter for OCI Data Flow i Oracle Analytics Cloud-projektmappeeditoren. Når du vælger en tabel eller kube, kan du føje dimensions- og målingskolonner til dine datasæt med henblik på analyse.