Анализ данных с помощью Explain

Explain использует машинное обучение для получения полезной аналитической информации о ваших данных.

Что такое Explain?

Функция Explain анализирует выбранный столбец в контексте его набора данных и создает текстовые описания с полученными аналитическими представлениями. Например, в любом столбце можно найти основные факты, ключевые факторы, сегменты, объясняющие столбец, и аномалии.

Explain использует машинное обучение Oracle для получения точной, быстрой и веской информации о ваших данных и создает соответствующие визуализации, которые вы можете добавить на холст своей рабочей книги.

Функция Explain предназначена для аналитиков, которые могут не знать, какие тренды данных им надо найти, и не хотят тратить время на эксперименты, перетаскивая столбцы на холст или используя потоки данных для обучения и применения моделей с предсказанием.

Функция Explain также предоставляет аналитикам полезную отправную точку, чтобы подтвердить тренд, который они ищут в своих данных, а затем использовать эту информацию для создания и настройки моделей с предсказанием, чтобы применить ее к другим наборам данных.

Что такое аналитические представления?

Аналитические представления — это категории, описывающие выбранный столбец в контексте его набора данных.

Значок руководства LiveLabs Sprint

Аналитические представления, обеспечиваемые функцией Explain, основаны на выборе типа столбца или агрегации и зависят от набора правил агрегации для выбранного показателя. Explain создает только такие аналитические представления, которые имеют смысл для столбца выбранного типа.

Тип аналитического представления Описание
Основные факты Отображается основное распределение значений столбца. Данные столбца разбиваются по каждому показателю набора данных.
Это аналитическое представление доступно для столбцов всех типов.
  • Для выбранного показателя это аналитическое представление показывает распределение агрегированного значения показателя для каждого элемента каждого столбца атрибутов.
  • Для выбранного атрибута в этом аналитическом представлении отображается значение каждого показателя в наборе данных из значений данного атрибута для элементов.
Ключевые определяющие факторы Показывает столбцы в наборе данных с наивысшей степенью корреляции с результатом выбранного столбца. Диаграммы показывают распределение выбранного значения по каждому коррелированному значению атрибутов.

Эта вкладка отображается только при применении функции Explain к столбцам атрибутов или столбцу показателей с правилом среднего агрегирования.

Сегменты Отображение ключевых сегментов (или групп) на основе значений столбцов. Explain применяет к данным алгоритм классификации для определения пересечений значений данных и выявления диапазонов значений во всех измерениях, которые создают наибольшую вероятность для заданного результата атрибута.

Например, группа лиц определенного возрастного диапазона из определенного набора местоположений, с определенным диапазоном лет образования образует сегмент с очень высокой вероятностью покупки определенного продукта.

Эта вкладка отображается только при применении функции Explain к столбцам атрибутов

Аномалии Определяет последовательность значений, в которой одно из (агрегированных) значений существенно отличается от того, который ожидается алгоритмами регрессии.

Получение аналитической информации с помощью Explain

Если выбрать столбец и функцию Explain, платформа Oracle Analytics использует машинное обучение для анализа столбца в контексте набора данных. Например, Explain выполняет поиск выбранных данных по ключевым определяющим факторам и аномалиям.

Explain отображает полученные результаты в виде текстовых описаний и визуализаций, которые можно добавить на холст.
Если функция Explain применена к столбцу и в результатах слишком много коррелированных столбцов с высоким рангом (например, почтовый индекс с городом и регионом), то некоторые столбцы из набора данных исключаются, чтобы функция Explain могла определить более значимые определяющие факторы. См. раздел "Скрытие или устранение столбца".
  1. На главной странице нажмите Создать, а затем Рабочая книга, чтобы создать новую рабочую книгу.
  2. Нажмите Визуализация, чтобы открыть страницу Визуализация.
  3. На панели данных правой кнопкой мыши нажмите на столбец и выберите Explain <элемент данных>.

    Команда Explain <элемент данных> отображается только при наличии права записи для набора данных.
    Для успешного анализа атрибута функции Explain требуется от трех до 99 разных значений.
    В диалоговом окне Explain отображаются основные факты, аномалии и другая информация о выбранном столбце.
  4. Просмотрите предлагаемые аналитические выводы в других категориях, нажав на вкладки. Например, основные факты о <attribute> или отклонения <attribute>.
  5. На каждый аналитический вывод, который требуется включить в холст рабочей книги, наведите указатель мыши и нажмите Выбрать для холста.
    Рядом с выбранными элементами должна появиться зеленая галочка.(Зеленая галочка).

    Можно выбрать несколько аналитических выводов с любой вкладки.
  6. Нажмите Добавить выбранное, чтобы добавить аналитические выводы, помеченные зеленой галочкой, на любую из вкладок.
    Аналитическими выводами Explain можно управлять так же, как любыми другими визуализациями, созданными вручную на холсте.
Для настройки аналитических выводов нажмите Настройки, чтобы изменить столбцы для анализа и настроить параметры для этой категории, например, выбрать минимальный размер сегментов.

Создание набора данных для использования вместе с функцией Explain

Функция Explain недоступна для использования с предметными областями, хранящимися в экземпляре Oracle Analytics. Однако на основе локальной темы можно создать набор данных, а затем использовать функцию Explain для анализа столбцов в наборе данных.

  1. На главной странице нажмите Создать, а затем — Набор данных.
  2. В диалоговом окне Создание набора данных выберите "Локальная предметная область".
  3. Необязательно: Выберите команду Выбрать столбцы для просмотра, обзора и поиска доступных предметных областей и столбцов. Выделите столбец и нажмите Добавить выбранное, чтобы добавить его в набор данных.
  4. Необязательно: Также можно выбрать команду Введите логический SQL, чтобы написать запрос или изменить запрос для столбцов, выбранных в области Выбрать столбцы.
  5. Необязательно: Выберите Нажмите на здесь, чтобы добавить фильтр и укажите критерии фильтрации столбцов.
  6. Нажмите Добавить, чтобы сохранить набор данных и перейти к редактору преобразований, чтобы преобразовать и обогатить данные набора данных.
  7. Необязательно: Нажмите Создать рабочую книгу , чтобы создать рабочую книгу с набором данных, а затем используйте функцию Explain.