Какие действия можно использовать для систематизации и интеграции данных?

Выполните следующие действия в потоках данных для систематизации, интеграции и преобразования данных. Например, можно объединить источники данных, агрегировать данные или выполнить геопространственный анализ.

Воспользуйтесь редактором потоков данных, чтобы выполнить эти действия с вашими потоками данных.
Описание GUID-A3C23A5E-F96B-4EC3-9E7F-5917492D8368-default.png ниже
.png

Добавление столбцов

Добавление пользовательских столбцов в свой целевой набор данных. Например, вы можете рассчитать стоимость своего запаса, умножив количество единиц в столбце UNITS на цену продажи в столбце RETAIL_PRICE (то есть, UNITS * RETAIL_PRICE).

Добавление данных

Добавьте источники данных в свой поток данных. Например, при объединении двух наборов данных вы добавляете оба набора данных в свой поток данных.

Агрегирование

Создание групповых итогов путем применения функций сведения. Например, подсчет, сумма или среднее значение.

Анализ тональности

Определение тональности для заданного текстового столбца. Например, можно проанализировать отзывы клиентов, чтобы определить, положительные они или отрицательные. В процессе анализа тональности текст проверяется на наличие определенных слов и фраз, указывающих на положительные, нейтральные или отрицательные эмоции. В зависимости от результатов анализа в новом столбце содержится строка "Положительно", "Нейтрально" или "Отрицательно".

Применение модели ИИ

Анализ данных с помощью модели искусственного интеллекта. Например, можно обнаруживать объекты, классифицировать изображения или распознавать текст с помощью модели, созданной в сервисе OCI Vision. См. раздел "Выполнение анализа "Обнаружение объектов", "Классификация изображений" и "Распознавание текста"". Кроме того, можно выполнить анализ языка, например анализ тональности и идентификация языка, используя модели, созданные в сервисе OCI Language.

Применение модели

Анализ данных путем применения модели машинного обучения из Oracle Machine Learning или OCI Data Science. Например, можно создать модель классификации, чтобы определять, являются ли сообщения электронной почты спамом. См. раздел "Применение модели с предсказанием или зарегистрированной модели машинного обучения Oracle к набору данных".

Применение пользовательского сценария

Преобразование данных, например, с помощью функции, определенной в Oracle Cloud Infrastructure (OCI). Например, можно использовать функцию для преобразования английского текста в испанский или немецкий. Администратор Oracle Analytics регистрирует эти функции, чтобы они были доступны пользователям.

AutoML

Использование функции AutoML из Oracle Autonomous Data Warehouse для рекомендации и обучения модели с предсказаниями. В ходе выполнения шага AutoML выполняется анализ данных, вычисление оптимального алгоритма и регистрация модели с предсказаниями в Oracle Analytics. Вычисление аналитики осуществляется в базе данных, а не в Oracle Analytics. Этот шаг доступен в селекторе шагов при подключении к набору данных на основе Oracle Autonomous Data Warehouse.

Ячейка

Назначьте значениям данных категории, такие как "высокие", "низкие" или "средние". Например, значения параметра RISK можно разделить на три группы для низких, средних и высоких значений.

Разветвление

Создание нескольких выводов из потока данных. Например, если есть данные о транзакциях продаж в различных странах, данные для США можно сохранить в первой ветви, а данные для Канады — во второй.

Создание куба Essbase

Создание куба Essbase на основе электронной таблицы или базы данных

Совокупное значение

Вычисление совокупных итогов, таких как перемещение или выполнение агрегирования.

Аналитика базы данных

Выполните расширенный анализ и интеллектуальный анализ данных. Например, можно обнаруживать аномалии, данные кластера, образцы данных и выполнять анализ сродства. Этот шаг доступен в селекторе шагов при подключении к набору данных на основе базы данных Oracle или Oracle Autonomous Data Warehouse. Вычисление аналитики осуществляется в базе данных, а не в Oracle Analytics. См. раздел Функции аналитики баз данных.

Фильтр

Выберите только интересующие вас данные. Например, можно создать фильтр, чтобы ограничить данные о доходах от продаж только периодом с 2020 по 2022 год.

Анализ графов

Выполните геопространственный анализ, например расчет расстояния или количества переходов между двумя вершинами. Этот шаг доступен в селекторе шагов при подключении к набору данных на основе базы данных Oracle или Oracle Autonomous Data Warehouse. Вычисление аналитики осуществляется в базе данных, а не в Oracle Analytics. См. раздел "Функции анализа графов".

Группирование

Разделение нечисловых данных на определенные группы. Например, заказы для направлений бизнеса Communication (Связь) и Digital (Цифровые) можно поместить в группу Technology (Технология), а заказы для направлений Games (Игры) и Stream (Потоковая передача) — в группу Entertainment (Развлечения).

Соединение

Объединяйте данные из нескольких источников данных, используя объединение базы данных на основе общего столбца. Например, можно объединить наборы данных Orders и Customer_orders, используя поле "Идентификатор клиента".

Объединение

Объедините несколько столбцов в один столбец. Например, можно в один столбец объединить столбцы с адресами улиц, названиями улиц, штатов и почтового индекса.

Переименование столбцов

Измените имя столбца на более значимое. Например, можно изменить ЯЧЕЙКА на "Контактный номер ячейки".

Изменение порядка столбцов

Изменение порядка столбцов в выходном наборе данных. Например, можно упорядочить столбцы в алфавитном порядке на основе имени столбца или в порядке на основе типа данных (символ, целое число и т. д.).

Сохранение данных

Укажите место сохранения данных, сгенерированных потоком данных. Данные можно сохранить в наборе данных в Oracle Analytics или в базе данных. Также можно указать параметры времени выполнения или изменить имя набора данных по умолчанию.

Выбор столбцов

Укажите, какие столбцы требуется включить или исключить из потока данных (по умолчанию должны быть включены все столбцы данных).

Разделение столбцов

Извлеките данные из столбцов. Например, если столбец содержит 001011Black, эти данные можно разделить на два отдельных столбца: 001011 и Black.

Прогноз временных рядов

Вычислите прогнозируемые значения на основе статистических данных. При создании прогноза берутся столбец времени и целевой столбец из заданного набора данных и рассчитываются прогнозные значения для целевого столбца.

Обучение <тип модели>

Обучите модели машинного обучения, используя алгоритмы численного прогнозирования, мультиклассификации, двоичной классификации и кластеризации. См. раздел "Шаги потока данных для обучения моделей машинного обучения".

Обучив модель машинного обучения, примените ее к данным в ходе выполнения шага Применить модель.

Преобразование столбцов

Измените формат, структуру или значения данных. Например, можно преобразовать текст в верхний регистр, удалить из данных начальные и концевые пробелы или рассчитать процентное увеличение стоимости.

Объединение строк

Объедините строки двух источников данных (в терминологии SQL за эту операцию отвечает команда UNION).