Cuando crea un juego de datos, Oracle Analytics realiza una creación de perfiles de nivel de columna para generar un juego de recomendaciones semánticas para reparar o enriquecer sus datos. Al crear libros de trabajo, también puede incluir enriquecimientos de conocimientos en las visualizaciones agregándolas desde el panel de datos.
Estas recomendaciones se basan en que el sistema detecta automáticamente un tipo semántico específico durante el paso del perfil. Por ejemplo, se crean perfiles de juegos de datos basadas en áreas temáticas locales con una muestra sencilla de N principales.
Existen categorías de tipos semánticos como ubicaciones geográficas que se identifican mediante nombres de ciudades, patrones reconocibles como en las tarjetas de crédito, direcciones de correo electrónico y números de seguridad social, fechas y patrones recurrentes. También puede crear sus propios tipos semánticos personalizados.
La creación de perfiles se aplica a varios tipos semánticos.
Se crean perfiles de categorías de tipos semánticos para identificar:
Los diferentes tipos de datos determinan las recomendaciones para reparar, mejorar o enriquecer los juegos de datos.
Estos son algunos ejemplos de recomendaciones de tipos semánticos:
Los tipos semánticos se identifican según los patrones que se encuentran en los datos.
Se proporcionan recomendaciones para estos tipos semánticos:
El reconocimiento de los tipos semánticos está determinado por el conocimiento de referencia cargado que se proporciona con el servicio.
Se proporcionan recomendaciones basadas en referencias para estos tipos semánticos:
Los enriquecimientos recomendados se basan en los tipos semánticos.
Los enriquecimientos se determinan según la jerarquía de la ubicación geográfica:
El proceso de creación de perfiles utiliza umbrales específicos para decidir sobre tipos semánticos específicos.
Como regla general, el 85% de los valores de datos de la columna deben cumplir el criterio de un único tipo de semántica para que el sistema pueda realizar la determinación de clasificación. Por ello, una columna que contenga un 70% de nombres y un 30% de otros elementos no cumple con los requisitos del umbral y, por lo tanto, no se generan recomendaciones.
Utilice las recomendaciones de conocimientos para aumentar los conocimientos del sistema Oracle Analytics. Los conocimientos personalizados permiten al analizador de perfiles semántico de Oracle Analytics identificar más tipos semánticos específicos del negocio y realizar recomendaciones de enriquecimiento más relevantes y gestionadas. Por ejemplo, puede agregar una referencia de conocimiento personalizado que clasifique el medicamento recetado en las categorías de medicamentos de la USP (Farmacopea de los Estados Unidos) de Analgésicos u Opiáceos.