О потоках данных

Потоки данных позволяют организовать и интегрировать данные для создания набора отобранных данных, который может визуализироваться пользователями.

Используйте потоки данных для визуального управления данными без необходимости в навыках написания кода вручную.

Например, поток данных можно использовать, чтобы:

  • Создать набор данных.
  • Объединить данные из разных источников.
  • Агрегировать данные.
  • Обучить модели машинного обучения или применить прогностическую модель машинного обучения к своим данным.
  • Обнаружить объекты, классифицировать изображения или распознать текст с помощью искусственного интеллекта сервиса OCI Vision.

Потоки данных создаются в редакторе потоков данных.
Редактор потоков данных

Чтобы создать поток данных, требуется добавить шаги. Каждый шаг выполняет определенную функцию, например, добавление данных, объединение таблиц, объединение столбцов, преобразование данных, сохранение данных. Для добавления и настройки шагов используется редактор потоков данных. Каждый шаг проверяется при добавлении или изменении. После настройки потока данных его следует выполнить, чтобы получить или обновить набор данных.

При добавлении собственных столбцов или преобразовании данных можно использовать широкий набор операторов SQL (например, BETWEEN, LIKE, IN), условные выражения (например, CASE) и функции (например, Avg, Median, Percentile).

Поддержка баз данных для потоков данных

Потоки данных позволяют отбирать данные из наборов данных, предметных областей или подключений к базам данных.

Потоки данных можно выполнять по отдельности или последовательно. В поток данных можно включить несколько источников данных и указать способ их объединения.

Действие Добавить данные позволяет добавить данные в поток данных, а действие Сохранить данные — сохранить выходные данные потока.

Выходные данные из потока данных можно сохранить как в наборе данных, так и в базе данных одного из поддерживаемых типов. В случае сохранения данных в базе данных источник данных можно преобразовать, перезаписав его данными из потока данных. Таблицы источника данных и потока данных должны находиться в одной и той же базе данных и должны иметь одинаковые имена. Перед началом работы создайте подключение к одному из поддерживаемых типов баз данных.

Примечание.:

Данные можно добавить из удаленных баз данных, подключенных с помощью Data Gateway. Однако сохранить данные в таких базах данных нельзя.

Выходные данные

Выходные данные потока можно сохранить в базах данных следующих типов:
  • Oracle Autonomous Data Warehouse
  • Обработка анонимных транзакций Oracle
  • База данных Oracle
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Подробнее о версиях баз данных см. в разделе Поддерживаемые источники данных.

Ввод данных

Данные в поток можно вводить из большинства типов баз данных (кроме Oracle Essbase и EPM Cloud).

Работа в редакторе потоков данных

Допустим, вы готовите данные для анализа, создавая потоки данных в редакторе потоков данных. Например, можно преобразовать столбцы, объединить их или распределить данные по ячейкам. Узнайте, как с помощью редактора потоков данных быстро приступить к подготовке данных.

Работа в редакторе потоков данных:

Имя Значок Что делает
Данные

Значок "Панель данных"

Открывает панель данных, столбцы данных из которой может потребоваться перетащить в редактор потоков данных.

Шаги потока данных Значок панели "Шаги потока данных"

Открывает панель шагов, откуда можно перетаскивать шаги в редактор потоков данных.

Предварительный просмотр данных

Значок "Предварительный просмотр данных"

Скрытие или отображение панели столбцов с предварительным просмотром данных путем нажатия значка переключения Предварительный просмотр данных в правом нижнем углу редактора потоков данных. При внесении изменении в поток данных эта панель автоматически обновляется. Нажав Автоприменение, можно указать, следует ли автоматически обновлять изменения этапов на панели "Предварительный просмотр данных".

Запуск потока данных Запуск потока данных Выполнение (также называется "запуск") потока данных.
Отображение/скрытие доступных функций

Значок "Показать/скрыть доступные функции"

Отображение или скрытие списка выбора выражений. Этот значок отображается только для шагов, которые позволяют создавать собственные выражения, например шаг "Добавить столбцы" или шаг "Преобразовать столбец".

Редактор шагов

Значок "Редактор шагов"

Скрытие или отображение панели редактора шагов путем нажатия на значок переключения Редактор шагов в правом нижнем углу редактора потоков данных.

Переключение автоматического обновления Переключение автоматического обновления данных в потоках данных Включите эту функцию, чтобы обновлять данные в окне предварительного просмотра сразу после внесения изменений в поток данных. Например, при выполнении шага преобразования столбца, который изменяет регистр текста с нижнего на верхний, то при предварительном просмотре данных будет отображаться текст в верхнем регистре. При отключении этой функции данные в окне предварительного просмотра обновляются только после нажатия Обновить предварительный просмотр данных.

(Предварительный просмотр) Работа в расширенном конструкторе потоков данных

Используйте новейший конструктор потоков данных для упрощения создания потоков данных с помощью расширенных функций. Этот пользовательский интерфейс предоставляет новые значки, улучшенное создание соединения и объединения, а также оптимизированную компоновку для бесшовной навигации.

Работа с усовершенствованным конструктором потоков данных

Если требуется использовать новый конструктор, попросите администратора включить его.

В обновленном конструкторе представлены новые значки и улучшения.


Описание GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png ниже
.png

Функция Значок Описание
Компактный макет Значок компактного макета Группируйте этапы в меньшую область просмотра, чтобы уменьшить прокрутку.
Развернутый макет Значок "Развернутый макет" Выравнивает этапы источника входных данных по левому краю для удобства чтения.
Неполное соединение или объединение

Значок завершения соединения или объединения

Указывает источник данных, который не участвует в соединении или объединении. Наведите курсор на значок синей ссылки, чтобы увидеть предлагаемую цель соединения (пунктирная линия) и нажмите еще раз, чтобы завершить соединение или объединение (сплошная линия).

Улучшения масштабирования Значок масштабирования Увеличение и уменьшение масштаба.