Página Estadísticas de datos

En la página Estadísticas de datos se muestra información sobre patrones y anomalías en los datos de entidades de Oracle Autonomous Database.

Para acceder a la página Data Insights, haga clic en el separador Data Studio de la página Database Actions y seleccione el menú Data Insights.


Descripción de data-insights.png siguiente

o haga clic en el icono SelectorSelector y seleccione Información de datos en el menú Herramientas de datos del panel de navegación.

En los siguientes temas, se describen las estadísticas y cómo generarlas y utilizarlas.

Acerca de Insights

Puede generar estadísticas para una tabla o para la vista analítica desplegada para el análisis de datos.

Las estadísticas que genera Data Insights para la vista analítica de un modelo de negocio pueden ser más útiles que las de una tabla debido a los metadatos adicionales que proporciona una vista analítica.

Las estadísticas resaltan los puntos de datos como posibles anomalías si el valor real de una medida al filtrar por pares de valores de jerarquía de vista analítica o valores de columna de tabla es considerablemente superior o inferior al valor esperado, calculado en todos los valores de jerarquía o columna. Las estadísticas resaltan patrones inesperados que puede que desee investigar.

Las estadísticas se generan automáticamente mediante diversas funciones analíticas integradas en la base de datos. Los resultados del análisis de estadísticas aparecen como una serie de gráficos de barras en el panel de control Estadísticas de datos.

Data Insights utiliza los siguientes pasos para generar estadísticas:

  1. Busca los valores de una medida, por ejemplo Ventas, en todos los pares distintos de valores de jerarquía o columna para la medida. Si Ventas tiene las jerarquías o columnas Estado civil, Banda de edad, Nivel de ingresos y Género, los pares serían los valores de cada valor distinto de cada jerarquía o columna combinados con cada valor distinto de cada una de las otras jerarquías o columnas. Por ejemplo, si los valores de Estado civil son Casado y Soltero, y los valores de Banda de edad son A, B y C, los pares serían Casado y A, Casado y B, Casado y C, Soltero y A, Soltero y B y Soltero y C. Cada valor distinto de Estado civil también se emparejaría con cada valor distinto de Nivel de ingresos y Género, etc.
  2. Estima un valor esperado para la medida para cada par de jerarquía o columna.
  3. Calcula el valor real de la medida para cada par de jerarquía o columna, por ejemplo, Marital Status = S, Age Band = C y, a continuación, la diferencia entre el valor real y el valor esperado.
  4. Puntúa todas las diferencias y selecciona las mayores variaciones entre los valores reales y esperados para resaltarlas como posibles estadísticas.

Las estadísticas resultantes resaltan casos en los que el valor de medida es significativamente mayor o menor para un par de valores de columna o jerarquía determinado que el esperado, por ejemplo, ventas mucho más altas en las que Estado civil = S y Banda de edad = C.

Las estadísticas de las vistas analíticas tienden a utilizar los niveles superiores de una jerarquía porque las diferencias entre los valores estimados y reales son generalmente mayores que para los atributos de nivel inferior. Por ejemplo, la diferencia en dólares entre las ventas estimadas y reales para todo Estados Unidos es generalmente mayor que la diferencia entre las ventas estimadas y reales para una ciudad con una población menor de 1000 habitantes. La diferencia se calcula en valores absolutos, no en porcentajes.

Las estadísticas de las tablas clasifican las columnas como columnas de dimensión o columnas de medida según sus tipos de datos y cardinalidad. Una columna VARCHAR2 siempre se clasifica como una dimensión, pero una columna NUMBER puede ser una dimensión o una medida. Por ejemplo, una columna NUMBER para los valores YEAR que solo tiene 10 valores distintos en una tabla con 1 millón de filas se supone que es una dimensión.

Generación de estadísticas y visualización de informes

Utilice estos procedimientos para generar estadísticas y ver informes sobre ellas.

Generar estadísticas

Para generar estadísticas para una tabla o modelo de negocio, realice lo siguiente:

  1. En el campo Esquema, seleccione un esquema.
  2. En el campo Tabla/vista analítica, seleccione una tabla o vista analítica.
  3. En el campo Columna, seleccione una columna que contenga datos sobre los que desee obtener estadísticas.
  4. Haga clic en Buscar.

Un aviso de confirmación informa de que la solicitud de estadísticas se ha enviado correctamente. Para cerrar el aviso, haga clic en el icono Cerrar (X) del aviso.

Una barra de progreso indica que la búsqueda está en curso y cuándo se ha completado. Las estadísticas aparecen en el panel de control Estadísticas de datos como una serie de gráficos de barras.

Para refrescar la visualización de las estadísticas, haga clic en Refrescar. Para que los refrescamientos se realicen automáticamente, haga clic en Activar refrescamiento automático.

Haga clic en Buscar para ver la lista de búsquedas de estadísticas anteriores.

Seleccione Ver errores para ver cualquier log de errores que se produzca durante su creación. Los resultados aparecen en un nuevo separador del explorador.

Ver el informe

Los gráficos del panel de control de Data Insights muestran los datos que contienen resultados anómalos. Las barras de un gráfico muestran los valores reales. Los valores esperados se indican mediante líneas horizontales verdes. Las barras que se indican en negro contienen las diferencias más significativas entre los valores esperados y los reales.

Por ejemplo, si la tabla de hechos para las estadísticas registra valores sobre un programa de seguro y las medidas de la tabla de hechos son AGE_CODE, GENDER_CODE, INCOME_CODE, NUM_INSURED, NUM_UNINSURED y AÑO, se pueden generar estadísticas para la medida NUM_INSURED. En ese caso, el panel de control tendría una serie de gráficos con las etiquetas YEAR y INCOME_CODE. Cada gráfico tendría un valor de la dimensión relacionada en la esquina superior izquierda. Por ejemplo, un gráfico INCOME_CODE que tenga un AGE_CODE relacionado podría tener el valor AGE_CODE 2 en la esquina superior izquierda.

Al hacer clic en un gráfico, se muestran más detalles al respecto. En la parte superior de la vista ampliada del gráfico se encuentra el nombre y el valor de la dimensión y un breve análisis textual de estadísticas destacadas. Debajo del análisis se muestra el gráfico con los valores y las estadísticas sobre ellos.

Por ejemplo, un gráfico para INCOME_CODE podría tener AGE_CODE = 2 en la parte superior, más el análisis textual. En el gráfico, los valores de INCOME_CODE estarán en el eje X y los valores de NUM_INSURED estarán en el eje Y. Al apuntar a una barra del gráfico ampliado, se muestra el valor de NUM_INSURED real y el esperado para INCOME_CODE y AGE_CODE.

Haga clic en el botón Atrás para volver al panel de control de Estadísticas de datos.

Visualización de informes anteriores

Para ver los resultados de una búsqueda anterior, haga clic en el icono Búsquedas recientes en la parte superior derecha. En el panel Búsquedas recientes, haga clic en cualquier lugar del cuadro de la búsqueda de estadísticas que desea ver.

Para filtrar las búsquedas anteriores, introduzca un valor en el campo de búsqueda situado en la parte superior del panel Búsquedas recientes.

Para cerrar el panel Búsquedas recientes sin seleccionar una búsqueda, haga clic en la X en la parte superior derecha del panel.