Översikt över analys av SQL-slutpunkter i OCI Data Flow

Du använder Oracles analysmoln för att analysera data från SQL-slutpunkter i OCI Data Flow i objektlagring, datasjöar och applikationer.

SQL-slutpunkter i Data Flow är utformade så att utvecklare, datavetare och avancerade analytiker interaktivt kan fråga på data direkt där de finns i datasjön.

Fördelar med att använda SQL-slutpunkter i OCI Data Flow

Du kan analysera stora volymer av händelse- och tidsseriedata på plats i datasjön utan att behöva flytta och summera dem för prestanda.
Du kan konsolidera data från flera applikationer och datalager (till exempel i affärssystem) i objektlagring och utföra ad hoc-frågor oavsett var dessa data kommer ifrån.
Du kan skippa utdrag och föraggregering och arbeta med verkliga data på valfri detaljgradsnivå. På så sätt sparar du inte bara tid och arbete när du förbereder data, utan får dessutom mer kraftfulla analysfunktioner.

Riktlinjer för prestanda

.png

Om du vill dra nytta av indexering och cachelagring på Spark-klusternivå skapar du en datamängd baserad på en enskild tabell eller vy. Datamängder baserade på flertabellskopplingar stöds, men rekommenderas inte.
När du konfigurerar klustret av SQL-datapunkter i OCI Data Flow anger du värdet sant för incrementalCollect, till exempel:
spark.sql.thriftServer.incrementalCollect=true;

Visualisera data från SQL-slutpunkter i OCI Data Flow

I arbetsboksredigeraren i Oracles analysmoln kan du lägga till flera tabeller eller kuber för SQL-slutpunkter i OCI Data Flow. När du väljer en tabell eller kub kan du lägga till dimensionskolumner och måttkolumner i datamängderna för analys.