Analizowanie punktów końcowych SQL usługi OCI Data Flow - przegląd

Korzystając z Oracle Analytics Cloud, można analizować dane z punktów końcowych SQL usługi OCI Data Flow w magazynie obiektów, repozytoriach danych "lake" i aplikacjach.

Punkty końcowe SQL usługi Data Flow są przeznaczone dla programistów, specjalistów data science i zaawansowanych analityków, którzy mogą dzięki nim tworzyć interaktywne zapytania o dane skierowane bezpośrednio do lokalizacji tych danych w repozytorium danych "lake".

Korzyści z używania punktów końcowych SQL usługi OCI Data Flow

  • Można analizować duże wolumeny danych ze zdarzeń i ciągów czasowych bezpośrednio na miejscu w repozytorium Data Lake, bez konieczności przenoszenia i sumowania tych danych w celu zapewnienia odpowiedniej wydajności.
  • Można konsolidować dane z wielu aplikacji i magazynów danych (na przykład z Enterprise Resource Planning) do magazynu obiektów i wykonywać zapytania doraźne bez względu na pochodzenie tych danych.
  • Można zrezygnować z ekstrakcji oraz wstępnej agregacji i pracować bezpośrednio na danych na dowolnym stopniu szczegółowości. Dzięki temu można nie tylko oszczędzić czas i zredukować nakłady pracy związane z przygotowywaniem danych, ale także korzystać z możliwości skuteczniejszej analizy.
Wydajność - najlepsze praktyki


  • Aby skorzystać z indeksowania i buforowania w warstwie klastra Spark, należy utworzyć zbiór danych na podstawie jednej tabeli lub widoku. Zbiory danych oparte na złączeniach wielu tabel są obsługiwane, ale nie są zalecane.
  • Podczas konfigurowania klastra punktów końcowych SQL usługi OCI Data Flow należy nadać ustawieniu incrementalCollect wartość true. Przykład:

    spark.sql.thriftServer.incrementalCollect=true;

Wizualizowanie danych z punktów końcowych SQL usługi OCI Data Flow

Korzystając z edytora skoroszytów Oracle Analytics Cloud, należy dodać tabele lub kostki z punktów końcowych SQL usługi OCI Data Flow. Po wybraniu tabeli lub kostki można do swoich zbiorów danych dodać kolumny wymiarów i kolumny miar, potrzebne do analiz.