Об обогащении и преобразовании данных в Oracle Analytics

Oracle Analytics упрощает обогащение и преобразование данных, прежде чем сделать их доступными для анализа.

значок руководства Руководство

Примечание.:

Обогащение знаний, как правило, включено по умолчанию, но редакторы рабочих книг могут включать или выключать его для тех наборов данных, которыми владеют или в отношении которых имеют полномочия на редактирование. Oracle Analytics не предоставляет автоматически рекомендации по обогащению наборов данных, созданных из потока данных. В этом случае владелец или администратор набора данных должен сначала включить параметр обогащения знаний для набора данных. См. Включение обогащения знаний для наборов данных.

Перейдите в редактор преобразований

На главной странице наведите курсор на набор данных, владельцем которого вы являетесь, нажмите Действия и выберите Открыть. Если набор данных содержит несколько таблиц, отобразится диаграмма объединений. На диаграмме объединений правой кнопкой мыши нажмите на источник данных, затем нажмите Открыть, чтобы отобразить редактор преобразований.

Редактор преобразований позволяет оценивать качество данных, редактировать метаданные, а также очищать и преобразовывать данные.


Описание GUID-E3648C3E-8811-435C-AFB1-BC4E0DE889B5-default.png ниже
.png

Чтобы преобразовать данные, нажмите Параметры (вертикальное многоточие в правой верхней части столбца данных Многоточие) и выберите параметр преобразования (например, Ячейка, Переименовать или Преобразовать в текст).


Описание GUID-48DD220C-19D2-4614-9E6B-ABE498632724-default.png ниже
.png

Применение рекомендуемых преобразований

При создании рабочей книги и добавлении к ней набора данных, данные подвергаются профилированию на уровне столбцов, выполняемому на репрезентативной выборке данных. После профилирования данных можно реализовать рекомендации по преобразованию и обогащению для распознаваемых столбцов в наборе данных. Чтобы последовать рекомендации, нажмите на нее в правой панели "Рекомендации".
Описание GUID-56820585-E7ED-4ECD-86F5-F008A0FE575B-default.png ниже
.png

Набор данных можно улучшить или преобразовать с помощью следующих действий:

  • Объединение двух отдельных столбцов в один. Например, если в наборе данных есть столбец имени и столбец фамилии, можно использовать рекомендацию для создания одного столбца с именем и фамилией.
  • Обогащения на основе пользовательских знаний, добавленные администратором в Oracle Analytics. Например, можно добавить финансовые даты в пользовательские знания для встраивания важных для конкретной компании сроков в ваши данные: это сделает аналитику более удобной и понятной.
  • Извлечение части даты, например выделение дня недели из столбца, в котором используется формат "месяц, день, год".
  • Удаление столбцов, содержащих поля с конфиденциальными данными.
  • Увеличение длительности для столбцов с датами с учетом срока извлечения в годах, месяцах или днях. Например, можно использовать созданный числовой столбец для назначения данных для ячеек, таких как 0–3 месяца, 3–6 месяцев, 6+ месяцев и т. д.
  • Система GPS обогащает данные такими сведениями, как широта и долгота городов или почтовые индексы.
  • Искажение или маскирование полей с конфиденциальными данными (полное и частичное).
  • Извлечение части, например выделение номера дома из названия улицы в адресе.
  • Семантические извлечения, например выделение информации из распознанного семантического типа, например домена из адреса электронной почты.

Применение собственных преобразований

В дополнение к рекомендуемым преобразованиям, которые отображаются на панели действий со столбцами, можно создавать собственные преобразования различными способами:

  • Используйте меню Параметры в верхней части каждого столбца, чтобы применить общие преобразования, такие как переименование, верхний регистр и обрезка. См. раздел "Преобразование данных".

  • На панели данных нажмите Добавить этап подготовки, чтобы добавить столбец на основе пользовательского преобразования. Вы можете построить столбец с помощью широкого спектра функций, например, операторов, математических операций, агрегирований и преобразования. См. раздел "Добавление столбцов в набор данных".
  • Используйте панель параметров Элемент в нижнем левом углу панели данных, чтобы изменить тип столбца (выберите для параметра Обрабатывать как атрибута или показатель), или измените тип агрегирования по умолчанию.

    Совет. Чтобы получить рекомендации по настройке типов столбцов, на панели инструментов нажмите на Обзор рекомендаций по автоматической обработке Значок "Обзор рекомендаций по автоматической обработке". Например, если семантический инструмент профилирования определяет столбец с числовым атрибутом (например, 1078220), как показатель, можно изменить этот столбец на атрибут.

Влияние преобразований наборов данных на рабочие книги и потоки данных

Примененные к набору данных изменения, вызванные преобразованием и обогащением данных, влияют на все рабочие книги и потоки данных, в которых используется этот набор данных. При открытии рабочей книги, в которой совместно используется набор данных, появляется сообщение об использовании в рабочей книге обновленных данных. При обновлении данных в наборе данных изменения сценария подготовки автоматически применяются к обновленным данным.

Обновление результатов профиля

Если системные или нестандартные знания обновлены, и у вас есть права автора набора данных, вы можете перепрофилировать и обновить результаты для текущего открытого набора данных, нажав Обновить результаты профиля на панели инструментов Значок "Обновить результаты профиля". Oracle Analytics обычно управляет этим обновлением за вас, поэтому в большинстве случаев вам не понадобится использовать эту возможность. Команда Обновить результаты профиля используется для перепрофилирования данных, если системные знания были обновлены, или были обновлены нестандартные знания и вы хотите включить их в текущий открытый набор данных. Когда доступны новые знания, значок Обновить результаты профиля отображает оповещение с количеством доступных обновлений.