Prehľad analýzy koncových bodov SQL v službe OCI Data Flow

Službu Oracle Analytics Cloud môžete použiť na analýzu dát z koncových bodov SQL v službe OCI Data Flow v objektovom ukladacom priestore, úložiskách Data Lake a aplikáciách.

Koncové body SQL dátového toku sú navrhnuté pre vývojárov, dátových výskumníkov a pokročilých analytikov na vykonávanie interaktívnych dopytov na dáta priamo tam, kde sa v úložisku Data Lake nachádzajú.

Výhody používania koncových bodov SQL v službe OCI Data Flow

Môžete analyzovať veľké objemy dát udalostí a časových sérií priamo v úložisku Data Lake bez toho, aby ste ich museli presúvať a sumarizovať na dosiahnutie lepšieho výkonu.
Dáta môžete konsolidovať z viacerých aplikácií a ukladacích priestorov dát (napríklad v systéme Enterprise Resource Planning) do objektového ukladacieho priestoru a potom vykonávať ad hoc dopyty bez ohľadu na to, odkiaľ dáta pochádzajú.
Môžete obísť extrakcie a predbežnú agregáciu a pracovať so živými dátami na ľubovoľnej úrovni podrobnosti. Môžete si tak nielen ušetriť čas a námahu pri príprave dát, ale aj využiť výkonnejšie možnosti analýzy.

Osvedčené postupy za zlepšenie výkonu

.png

Aby ste mohli využívať výhody indexovania a ukladania do cache vo vrstve klastra Spark, vytvorte množinu dát založenú na jednej tabuľke alebo zobrazení. Množiny dát založené na spojeniach viacerých tabuliek sú podporované, ale neodporúčajú sa.
Po konfigurácii klastra koncových bodov SQL v službe OCI Data Flow nastavte incrementalCollect na hodnotu pravda, napríklad:
spark.sql.thriftServer.incrementalCollect=true;

Vizualizácia dát z koncových bodov SQL v službe OCI Data Flow

V editore zošita Oracle Analytics Cloud pridajte viaceré tabuľky alebo kocky koncových bodov SQL v službe OCI Data Flow. Pri výbere tabuľky alebo kocky môžete do množín dát pridávať stĺpce dimenzií a stĺpce mier na analýzu.