Prehľad analýzy koncových bodov SQL v službe OCI Data Flow

Službu Oracle Analytics Cloud môžete použiť na analýzu dát z koncových bodov SQL v službe OCI Data Flow v objektovom ukladacom priestore, úložiskách Data Lake a aplikáciách.

Koncové body SQL dátového toku sú navrhnuté pre vývojárov, dátových výskumníkov a pokročilých analytikov na vykonávanie interaktívnych dopytov na dáta priamo tam, kde sa v úložisku Data Lake nachádzajú.

Výhody používania koncových bodov SQL v službe OCI Data Flow

  • Môžete analyzovať veľké objemy dát udalostí a časových sérií priamo v úložisku Data Lake bez toho, aby ste ich museli presúvať a sumarizovať na dosiahnutie lepšieho výkonu.
  • Dáta môžete konsolidovať z viacerých aplikácií a ukladacích priestorov dát (napríklad v systéme Enterprise Resource Planning) do objektového ukladacieho priestoru a potom vykonávať ad hoc dopyty bez ohľadu na to, odkiaľ dáta pochádzajú.
  • Môžete obísť extrakcie a predbežnú agregáciu a pracovať so živými dátami na ľubovoľnej úrovni podrobnosti. Môžete si tak nielen ušetriť čas a námahu pri príprave dát, ale aj využiť výkonnejšie možnosti analýzy.
Osvedčené postupy za zlepšenie výkonu


  • Aby ste mohli využívať výhody indexovania a ukladania do cache vo vrstve klastra Spark, vytvorte množinu dát založenú na jednej tabuľke alebo zobrazení. Množiny dát založené na spojeniach viacerých tabuliek sú podporované, ale neodporúčajú sa.
  • Po konfigurácii klastra koncových bodov SQL v službe OCI Data Flow nastavte incrementalCollect na hodnotu pravda, napríklad:

    spark.sql.thriftServer.incrementalCollect=true;

Vizualizácia dát z koncových bodov SQL v službe OCI Data Flow

V editore zošita Oracle Analytics Cloud pridajte viaceré tabuľky alebo kocky koncových bodov SQL v službe OCI Data Flow. Pri výbere tabuľky alebo kocky môžete do množín dát pridávať stĺpce dimenzií a stĺpce mier na analýzu.