¿Qué son las estadísticas de calidad?

Oracle Analytics analiza automáticamente la calidad de los datos para ayudarle a limpiar y enriquecer los datos.

Cuando se edita una tabla en el diagrama de unión o en el editor de transformación, Oracle Analytics analiza la calidad de los datos y proporciona un resumen visual conocido como una estadística visual en un mosaico sobre cada columna. Las estadísticas de calidad le permiten explorar los datos y utilizar una visión general visual del contenido para evaluar y mejorar la calidad de los datos. El resumen de calidad está basado en una muestra de los datos, pero los cambios que realice se aplican a todos los datos. Las estadísticas de calidad muestran un mosaico de frecuencia para el texto o un histograma para las fechas y los números.
A continuación se muestra la descripción de GUID-121574FF-FDDF-4F06-839E-0961330D727D-default.png
.png

Los mosaicos de calidad le permiten:

  • Explorar: explore los datos en tiempo real utilizando el filtrado instantáneo, que le permite filtrar temporalmente los datos en todas las columnas de la tabla. Puede filtrar por varios valores al mismo tiempo.
    A continuación se muestra la descripción de GUID-AC6937D9-56BF-4187-B331-458C058A212F-default.png
    .png

    El valor que se va a filtrar se marca con un recuadro verde. Los filtros no se agregan al script de preparación de datos.

  • Revisar: utilice las visualizaciones interactivas, como los gráficos de barras y los histogramas, para evaluar los datos e identificar anomalías y valores atípicos.
    A continuación se muestra la descripción de GUID-BE824B14-2696-466C-B095-D06F9B8785ED-default.png
    .png

    Los mosaicos de calidad situados en la parte superior de cada columna proporcionan una evaluación instantánea de la calidad del contenido en esa columna basada en una profunda comprensión semántica de los datos.

  • Evaluar: pase el cursor sobre la barra de calidad para ver un resumen emergente que muestra el porcentaje de valores válidos y no válidos. Haga clic en las áreas marcadas en rojo para filtrar por valores no válidos.
    A continuación se muestra la descripción de GUID-6F8FAAD4-43E0-4299-9215-645300C07E37-default.png
    .png
  • Sustituir o corregir: una vez que ha identificado las anomalías y los valores atípicos, utilice la sustitución en línea para corregir valores. Obtendrá comentarios inmediatos sobre las mejoras en la calidad de los datos en la barra de calidad.
    A continuación se muestra la descripción de GUID-5579C94E-DFC4-4D9E-8C12-0FE4C09EC55C-default.png
    .png
  • Desplazarse: desplácese por grandes juegos de datos utilizando un minimapa desplazable.
    A continuación se muestra la descripción de GUID-FFE24881-65F7-4008-ADB9-6F9853CEE65A-default.png
    .png
  • Renombrar columnas: cree fácilmente nombres de columna más legibles.
    A continuación se muestra la descripción de GUID-11E8E5C0-BCD7-42C4-8534-F7E4F3E33FE3-default.png
    .png

Asegúrese de conmutar el botón de opción Mosaicos de calidad hacia la derecha para mostrar los mosaicos de calidad.
A continuación se muestra la descripción de GUID-8B6BAB49-7A5A-421F-9D96-FFFC1B8123DF-default.png
.png