Prezentare generală a analizelor cu punctele de date SQL din OCI Data Flow

Utilizaţi Oracle Analytics Cloud pentru a analiza datele din punctele finale SQL pentru OCI Data Flow în Object Storage, în data lake-uri şi în aplicaţii.

Punctele de date SQL pentru OCI Data Flow sunt concepute pentru ca dezvoltatorii, specialiştii în date şi analiştii avansaţi să interogheze interactiv datele, direct acolo unde se află acestea în data lake.

Beneficiile utilizării OCI Data Flow SQL Endpoints

  • Puteţi analiza volume mari de date aferente evenimentelor şi seriilor temporale in-place, în data lake, fără să trebuiască să le mutaţi şi le sumarizaţi pentru performanţa analizei.
  • Puteţi consolida date din mai multe aplicaţii şi bănci de date (de exemplu, din Enterprise Resource Planning) în Object Storage şi puteţi efectua interogări ad-hoc, indiferent de originea datelor.
  • Nu mai este nevoie să utilizaţi extrase şi să efectuaţi pre-agregări, ci puteţi lucra cu date live, la orice nivel de granularitate doriţi. Aşadar, puteţi pregăti datele mai rapid şi cu mai puţin efort, beneficiind totodată de capabilităţi de analiză mai puternice.
Cele mai bune practici pentru a obţine performanţe optime


  • Pentru a beneficia de indexarea şi plasarea în cache la nivel de clustere Spark, creaţi un set de date pe baza unui singur tabel sau a unei singure vizualizări. Seturile de date care au la bază joinurile de mai multe tabele sunt acceptate, însă nu sunt recomandate.
  • Când configuraţi clusterul de puncte finale SQL pentru OCI Data Flow, setaţi incrementalCollect la true, de exemplu:

    spark.sql.thriftServer.incrementalCollect=true;

Vizualizarea datelor din OCI Data Flow SQL Endpoints

În editorul de registre de lucru Oracle Analytics Cloud, adăugaţi mai multe tabele sau cuburi ale punctelor finale SQL din OCI Data Flow. Atunci când selectaţi un tabel sau un cub pentru analiză, puteţi adăuga la seturile de date coloane de dimensiuni şi coloane de indicatori.