Descripción de visualizaciones generadas por Estadísticas contextuales

El algoritmo Estadísticas contextuales genera muchos tipos de visualizaciones para representar varias estadísticas, clasificadas por nivel de interés funcional.

Para clasificar estas estadísticas, el algoritmo ejecuta varios análisis utilizando las columnas relacionadas y selecciona aquellas en las que los datos muestran un contraste importante entre la selección y el resto de los datos. El orden en el que aparecen las estadísticas depende de los datos. En cada estadística, su selección aparece en color rojo, mientras que el resto de los datos se muestra en color azul.

Desglose por atributo

Estadísticas contextuales presenta tres tipos de visualizaciones de desglose. La forma global de las distribuciones le ayuda a ver rápidamente qué miembros de su selección presentan un contraste significativo con el resto de los datos.

Un desglose se puede representar como un gráfico de barras de doble eje en el que las barras representan el desglose de los datos seleccionados y la línea representa el desglose de los datos restantes. Los miembros se ordenan del más alto al más bajo en relación con el resto de los datos.

Por ejemplo, esta estadística desglosa las ventas por contenedor de productos. La descripción proporcionada indica que en el caso del contenedor de productos Small Box, los datos seleccionados tienen unas ventas significativamente más bajas en comparación con el resto de los datos. También indica que los contenedores de productos Jumbo Drum y Jumbo Box de los datos seleccionados presentan ventas mucho más altas que el resto de los datos.
A continuación se muestra la descripción de GUID-83A2EFAB-B373-44A5-822B-864E69DD5711-default.png
.png

Un desglose dimensional también se puede representar como un trazo de dispersión de doble eje en el que cada punto representa el desglose de los datos seleccionados y la línea representa el desglose de los datos restantes. Los miembros se ordenan del más alto al más bajo en relación con el resto de los datos.

Por ejemplo, esta estadística desglosa los beneficios por subcategoría de producto. Los datos seleccionados para los beneficios muestran diferencias significativas para subcategorías de productos como Telephones and Communication, Binders and Binder Accessories y Chairs & Chairmats.
A continuación se muestra la descripción de GUID-23A0AB0F-1994-4D39-A1E3-A4E6AA2C184B-default.png
.png

Un desglose también se puede representar como un gráfico de líneas radial en el que el desglose de la línea de datos seleccionada y el resto de la línea de datos se indexan a una escala normalizada.

Por ejemplo, esta estadística desglosa las ventas por modo de envío. Las formas de los datos seleccionados y el resto de los datos indican diferencias significativas para los modos de envío Delivery Truck y Regular Air.
A continuación se muestra la descripción de GUID-C42B2C08-9E1A-4773-8A2E-2E0E14EA3CAF-default.png
.png

Tendencias

Las visualizaciones de tendencias comparan el crecimiento relativo de una métrica a lo largo del tiempo para su selección y el resto de los datos usando líneas para mostrar la evaluación de cada una. El algoritmo utiliza la primera columna de fecha que aparece en la sección Columnas relacionadas del panel Gramática.

Cada línea empieza por un valor de índice base de 1,00 definido en un período de tiempo inicial. La evolución de la métrica a lo largo del tiempo muestra el valor relativo en los siguientes períodos en comparación con el valor de índice 1,00 del período inicial. Al observar los valores absolutos para la métrica, las discrepancias en los valores hacen que sea difícil comparar correctamente cualquier crecimiento o descenso a lo largo del tiempo.

Por ejemplo, esta estadística muestra la tendencia en las ventas por fecha de envío. La descripción proporciona estadísticas adicionales sobre el rendimiento global de las ventas a lo largo del tiempo. La descripción también resalta los intervalos de los datos en los que hay una diferencia significativa en la tendencia entre su selección y el resto de los datos. En este caso, de 2014 a 2015.
A continuación se muestra la descripción de GUID-86D4AD9F-CB88-45DE-BC41-E1E52FFEDD3F-default.png
.png

Tendencias de valores

Este tipo de visualización de tendencias muestra la tendencia de una métrica por columnas derivadas de fecha u hora. Mientras que los gráficos de tendencias se indexan en los valores iniciales, los gráficos de tendencias de valores son gráficos de doble eje no indexados. Los gráficos de tendencias de valores son útiles para identificar diferencias entre los datos seleccionados y el resto de los datos en la columna derivada de fecha u hora seleccionada.

Por ejemplo, esta estadística muestra la tendencia de valor de beneficio con respecto a una columna de fecha derivada denominada Ship Date (Month of Year).
A continuación se muestra la descripción de GUID-2C0247D5-7827-49ED-B40D-6AF251C32F89-default.png
.png

Correlación

Este tipo de gráfico muestra cómo se correlacionan las distintas métricas con otra métrica específica comparando los datos seleccionados con el resto de los datos. Al mostrar las correlaciones en paralelo, esta visualización resalta las similitudes y diferencias notables entre los dos grupos de datos. Las visualizaciones de correlación solo están disponibles cuando al menos una métrica muestra una diferencia significativa en la correlación entre los datos seleccionados y el resto de los datos. Las correlaciones de estas métricas se calculan en el nivel de datos más granular para la visualización de origen.

Por ejemplo, esta estadística muestra los patrones de correlación entre las ventas y otras métricas de negocio disponibles denominadas Profit, Quantity Ordered, Shipping Cost y Gross Unit Price.
A continuación se muestra la descripción de GUID-FA7404C9-A2EF-429F-8D43-DE7059E7872C-default.png
.png

Principales diferencias

Este es un tipo de gráfico de desglose. Compara los patrones de una métrica entre los datos seleccionados y el resto de los datos, centrándose en los 10 casos principales con las mayores diferencias. Cuando se trata de atributos que tienen una cardinalidad alta, por ejemplo, ciudades o productos, este gráfico resalta las variaciones más significativas de la métrica.

Por ejemplo, esta estadística muestra las diez ciudades en las que las ventas difieren más (ya sean superiores o inferiores) entre los datos seleccionados y el resto de los datos.
A continuación se muestra la descripción de GUID-2E0228F5-B335-4771-9158-4D68A36FD246-default.png
.png

80/20

Este tipo de visualización muestra qué proporción de su valor de métrica consta del 20 % superior de los registros y qué proporción consta del 80 % inferior de los registros cuando se ordenan los datos según su métrica. La visualización también muestra lo mismo para el resto de los datos. Esto se calcula en el nivel más granular de los datos en la visualización de origen.

Por ejemplo, esta estadística muestra las proporciones 80/20 ordenadas por ventas utilizando dos barras: la primera para el resto de los datos, y la segunda para su selección. La descripción destaca el hecho de que la proporción es muy diferente entre las dos.
A continuación se muestra la descripción de GUID-EE1240F2-7986-42F4-A139-CCDC472D6396-default.png
.png