Обзор анализа конечных точек OCI Data Flow SQL

Можно использовать Oracle Analytics Cloud для анализа данных из конечных точек OCI Data Flow SQL в объектном хранилище, озерах данных и приложениях.

Конечные точки Data Flow SQL предназначены для разработчиков, специалистов по анализу данных и опытных аналитиков, чтобы в интерактивном режиме запрашивать данные непосредственно оттуда, где они находятся в озере данных.

Преимущества использования конечных точек OCI Data Flow SQL

  • Можно анализировать большие объемы данных событий и временных рядов в озере данных, не перемещая и не суммируя их для повышения производительности.
  • Можно консолидировать данные из нескольких приложений и хранилищ данных (например, при планировании потребностей предприятия в ресурсах) в хранилище объектов и выполнять нерегламентированные запросы независимо от того, где созданы данные.
  • Можно распределять данные с помощью выборки и предварительном агрегировании, а также работать с ними в режиме реального времени на любом уровне детализации. Это позволит не только сэкономить время и усилия при подготовке данных, но и использовать более мощные возможности анализа.
Передовые практики для повышения производительности


  • Для использования преимуществ индексирования и кэширования на уровне кластера Spark создайте набор данных на основе одной таблицы или представления. Наборы данных, основанные на объединении нескольких таблиц, поддерживаются, но не рекомендуются.
  • При настройке кластера конечных точек OCI Data Flow SQL установите для параметра incrementalCollect значение true, например:

    spark.sql.thriftServer.incrementalCollect=true;

Визуализация данных из конечных точек OCI Data Flow SQL

В редакторе рабочей книги Oracle Analytics Cloud добавьте несколько таблиц или кубов конечных точек OCI Data Flow SQL. При выборе таблицы или куба можно добавить столбцы измерений и показателей в наборы данных для анализа.