Общая информация о визуализациях, сгенерированных контекстной аналитикой

Алгоритм контекстной аналитики генерирует множество типов визуализаций для отображения различных аналитических данных, ранжированных по уровню функционального интереса.

Чтобы ранжировать эти данные, алгоритм выполняет различные варианты анализа, используя связанные столбцы, и выбирает те результаты, где данные показывают явный контраст между выбранными и остальными данными. Порядок, в котором аналитика отображается, зависит от данных. В каждом анализе ваша выборка показана оранжевым цветом, а остальные данные — синим.

Разбивка по атрибутам

Контекстная аналитика представляет три типа визуализаций разбивки. Общая форма распределения помогает быстро понять, какие элементы в выборке заметно контрастируют с остальными данными.

Разбивку можно представить в виде столбчатой диаграммы с двумя осями, где столбцы представляют разбивку выбранных данных, а линия показывает разбивку остальных данных. Элементы отсортированы от наибольшего к наименьшему на основе остальных данных.

Например, анализ предлагает разбивку продаж по контейнерам продуктов. Приведенное описание показывает, что в случае контейнера Small Box данные о продажах в выборке существенно ниже по сравнению с остальными данными. Кроме того, видно, что продажи для контейнеров Jumbo Drum и Jumbo Box в выборке намного выше, чем в остальных данных.
Описание GUID-83A2EFAB-B373-44A5-822B-864E69DD5711-default.png ниже
.png

Разбивку по измерениям также можно представить в виде столбчатой диаграммы с двумя осями, где каждая точка представляет разбивку выбранных данных, а линия показывает разбивку остальных данных. Элементы отсортированы от наибольшего к наименьшему на основе остальных данных.

Например, на этой диаграмме прибыль разбита по подкатегориям продуктов. Выбранные данные по прибыли демонстрируют значительные различия для подкатегорий продуктов, таких как телефоны и связь, папки-скоросшиватели и аксессуары для них, а также стулья и защитные покрытия под офисные кресла.
Описание GUID-23A0AB0F-1994-4D39-A1E3-A4E6AA2C184B-default.png ниже
.png

Разбивку также можно представить в виде радарной диаграммы, где линия разбивки выбранных данных и линия остальных данных приводятся к единому масштабу шкалы.

Например, на этой диаграмме показана разбивка продаж по видам доставки. Формы выбранных и остальных данных указывают на значительные различия между доставкой грузовыми автомобилями и регулярным воздушным транспортом.
Описание GUID-C42B2C08-9E1A-4773-8A2E-2E0E14EA3CAF-default.png ниже
.png

Учет трендов

Визуализации трендов позволяют сравнить относительный рост метрики в выборке и в остальных данных. Рост отображается отдельными линиями. Алгоритм использует первый столбец данных, который появляется в разделе "Связанные столбцы" на панели синтаксиса.

Каждая строка начинается с базового значения индекса 1.00, установленного в исходный период времени. Изменение метрики с течением времени показывает относительное значение в последующие периоды по сравнению со значением индекса 1.00 в исходном периоде. При анализе абсолютных значений метрик из-за различий в значениях часто бывает сложно корректно сравнить рост или спад.

Например, этот анализ показывает тренд продаж по дате отгрузки. В описании содержатся дополнительные аналитические выводы относительно общей результативности продаж на протяжении периода времени. Кроме того в описании выделены интервалы, где существует значительная разница между трендом в выборке и трендом в остальных данных, в данном случае — с 2014 по 2015 год.
Описание GUID-86D4AD9F-CB88-45DE-BC41-E1E52FFEDD3F-default.png ниже
.png

Учет тренда значения

Этот тип визуализации тренда показывает тренд метрики по производным столбцам "Дата" или "Время". В то время как диаграммы трендов индексируются относительно начальных значений, диаграммы трендов значений представляют собой неиндексированные диаграммы с двумя осями. Диаграммы трендов значений полезны для определения различий между выбранными и остальными данными по выбранному производному столбцу даты или времени.

Например, эта диаграмма показывает тренд значения прибыли по производному столбцу даты с именем "Ship Date (Month of year)".
Описание GUID-2C0247D5-7827-49ED-B40D-6AF251C32F89-default.png ниже
.png

Корреляция

Этот тип диаграммы визуализирует, как различные метрики соотносятся с другой конкретной метрикой, сравнивая выбранные данные с остальными. Показывая корреляции друг рядом с другом, эта визуализация выделяет любые заметные сходства и различия между двумя группами данных. Визуализации корреляции доступны только в том случае, если по крайней мере одна метрика показывает значимую разницу в корреляции между выбранными и остальными данными. Корреляции для этих метрик рассчитываются на самом детализированном уровне данных для вашей исходной визуализации.

Например, эта диаграмма показывает закономерности корреляции между продажами и другими доступными бизнес-метриками, такими как прибыль, заказанное количество, стоимость доставки и валовая цена за единицу.
Описание GUID-FA7404C9-A2EF-429F-8D43-DE7059E7872C-default.png ниже
.png

Основные различия

Это тип диаграммы с разбивкой. Она сравнивает изменение метрики для выбранных и остальных данными, фокусируясь на 10 главных случаях с наибольшими различиями. При работе с атрибутами с высокой кардинальностью, например городами или продуктами, эта диаграмма выделяет наиболее значительные изменения метрики.

Например, на этой диаграмме показаны десять городов, где расхождение по продажам наиболее велико (в любую сторону) между выбранными и остальными данными.
Описание GUID-2E0228F5-B335-4771-9158-4D68A36FD246-default.png ниже
.png

80/20

Этот тип визуализации показывает, какую долю значений метрики составляют верхние 20 % записей, а какую — нижние 80 %, если данные выбраны по вашей метрике. Кроме того, визуализация показывает те же результаты для остальных данных. Вычисления проводятся на самом нижнем уровне данных в исходной визуализации.

Например, этот анализ показывает соотношение 80/20 для сортировки по продажам, используя два столбца: первый для остальных данных, а второй — для выборки. В описании выделен тот факт, что соотношение в двух случаях заметно отличается.
Описание GUID-EE1240F2-7986-42F4-A139-CCDC472D6396-default.png ниже
.png