Přehled k analýze koncových bodů SQL služby OCI Data Flow

Službu Oracle Analytics Cloud používáte k analýze dat z koncových bodů SQL služby OCI Data Flow v úložišti objektů, datových jezerech a aplikacích.

Koncové body SQL služby Data Flow jsou navrženy pro vývojáře, datové vědce a zkušené analytiky, aby se mohli interaktivně dotazovat na data přímo tam, kde se v datovém jezeře vyskytují.

Výhody používání koncových bodů SQL služby OCI Data Flow

  • Můžete analyzovat velké objemy dat událostí a časových řad přímo v datovém jezeře, aniž byste je museli kvůli výkonu přesouvat a sumarizovat.
  • Můžete konsolidovat data z více aplikací a úložišť dat (například v plánování podnikových zdrojů) do úložiště objektů a provádět ad hoc dotazy bez ohledu na to, odkud data pocházejí.
  • Obejdete se bez extrakcí a předběžné agregace a můžete pracovat na aktivních datech na jakékoli úrovni podrobnosti. Nejenže tak můžete ušetřit čas a úsilí při přípravě dat, ale také získáte výkonnější možnosti analýzy.
Osvědčené postupy pro výkon


  • Chcete-li využít výhod indexování a ukládání do paměti cache ve vrstvě Cluster Spark, vytvořte datovou sadu založenou na jedné tabulce nebo jednom zobrazení. Datové sady založené na spojení více tabulek jsou podporovány, ale jejich použití není doporučeno.
  • Když konfigurujete cluster koncových bodů SQL služby OCI Data Flow, nastavte parametr incrementalCollect na hodnotu true, například:

    spark.sql.thriftServer.incrementalCollect=true;

Vizualizace dat z koncových bodů SQL služby OCI Data Flow

V editoru sešitu služby Oracle Analytics Cloud přidejte více tabulek nebo krychlí koncových bodů SQL služby OCI Data Flow. Když vyberete tabulku nebo krychli, můžete do datových sad přidávat sloupce dimenzí a sloupce ukazatelů k analýze.