Overzicht van het analyseren van OCI Data Flow SQL-eindpunten

U gebruikt Oracle Analytics Cloud om gegevens van OCI Data Flow SQL-eindpunten in objectopslag, data lakes en applicaties te analyseren.

Data Flow SQL-eindpunten zijn ontworpen voor ontwikkelaars, gegevenswetenschappers en ervaren analisten om interactief query's uit te voeren op gegevens op de locatie waar deze zich bevinden in een data lake.

Voordelen van het gebruik van OCI Data Flow SQL Endpoints

U kunt grote volumes event- en tijdseriegegevens uit het data lake analyseren zonder dat u deze hoeft te verplaatsen en samen te vatten om het prestatieniveau op peil te houden.
U kunt gegevens uit meerdere applicaties en opslagplaatsen (bijvoorbeeld in Enterprise Resource Planning) consolideren in een objectopslag en vervolgens ad-hocquery's uitvoeren, ongeacht de herkomst van de gegevens.
Extracten maken en vooraf aggregeren hoeft niet meer. U kunt nu werken met live gegevens en op elk granulatieniveau. U bespaart dus niet alleen tijd en moeite bij het voorbereiden van de gegevens, u beschikt ook over krachtigere analysemogelijkheden.

Aanbevolen werkwijzen voor goede prestaties

.png

Als u gebruik wilt maken van de indexering en caching op het niveau van de Spark-cluster, maakt u een gegevensset die is gebaseerd op één tabel of weergave. Gegevenssets op basis van joins met meerdere tabellen worden weliswaar ondersteund, maar het gebruik hiervan wordt afgeraden.
Wanneer u de OCI Data Flow SQL-eindpuntencluster configureert, stelt u incrementalCollect in op 'Waar', bijvoorbeeld:
spark.sql.thriftServer.incrementalCollect=true;

Gegevens van OCI Data Flow SQL Endpoints visualiseren

Voeg in de werkmapeditor van Oracle Analytics Cloud meerdere tabellen of kubussen met OCI Data Flow SQL Endpoints toe. Wanneer u een tabel of kubus selecteert, kunt u voor analyse dimensiekolommen en eenheidkolommen toevoegen aan uw gegevenssets.