Interpretación de los resultados de un modelo de análisis de similitud

Al ejecutar un flujo de datos para realizar un análisis de similitud, Oracle Analytics genera un juego de datos con los resultados.

Acciones que puede realizar:

Busque el juego de datos generado en la página Datos de Oracle Analytics. Busque un juego de datos en el que se haya especificado el nombre en el paso Guardar datos del flujo de datos. El juego de datos contiene las mismas columnas de salida que se muestran en la sección Salidas del paso Análisis de similitud del flujo de datos.

.png

Columnas del juego de datos generadas por el modelo de análisis de similitud:
- source_value: devuelve la columna con un único valor dentro de esa columna que se ha seleccionado en el flujo de datos como objeto de origen. La distancia vectorial se mide con este valor con respecto al resto de valores de esta columna.
- source_reference_column1: devuelve el valor seleccionado de la columna de referencia (como se define en las propiedades del nodo de flujo de datos) para los registros que se han seleccionado en los registros de origen para el análisis de similitud. Gracias a esta salida ahora podrá determinar cuál es el registro de origen para el que ha encontrado los registros más cercanos o más lejanos.
- results_reference_column1, 2 y 3: devuelve el valor de las respectivas columnas de referencia (como se define en las propiedades del nodo de flujo de datos) para los registros que se han identificado como más cercanos o más lejanos mediante el análisis de similitud.
- distance: distancia calculada entre el valor de origen y el registro de resultados. Es decir, cuál es la similitud o diferencia de los datos de source_reference_col1, source_reference_col2 y de source_reference_col3 con respecto a result_reference1, result_reference2 y result_reference3.
- profile_expression: expresión concatenada de todas las columnas utilizadas en el modelo de análisis de similitud en una sola cadena. Estas son las columnas para las que el modelo de incrustación ha vectorizado los valores.
  
  Nota:
  Las columnas de atributos que ha seleccionado forman parte de la cadena de perfil, mientras que las medidas de las columnas de métricas se clasifican primero de forma dinámica en bandejas bajas, intermedias y altas para que se representen correctamente en los vectores.
Cree un libro de trabajo basado en el juego de datos de salida generado por el flujo de datos del análisis de similitud.
Cree visualizaciones para analizar los resultados. Por ejemplo:

.png

Consejo: Para obtener visualizaciones y estadísticas mejorados, agregue el juego de datos original y únase a los datos de salida del modelo mediante el ID de miembro. Esto le proporciona un nivel adicional de detalle para medir la distancia vectorial a algunos de los atributos originales del juego de datos.