Aplicación de un modelo de análisis de similitud a los datos

Utilice un flujo de datos para aplicar un modelo de incrustación de vector a un juego de datos con el fin de realizar un análisis de similitud, donde se identifiquen los registros similares a un registro determinado.

Antes de comenzar, asegúrese de que cumple los requisitos para realizar este tipo de análisis. Consulte Requisitos para realizar análisis de similitud en Oracle Analytics.
  1. En la página inicial, haga clic en Crear y, a continuación, en Flujo de datos.
  2. En Agregar datos, seleccione el juego de datos que contiene los datos que desea analizar y, a continuación, haga clic en Agregar.
    El juego de datos debe basarse en Oracle Database o en Oracle Autonomous Data Warehouse.
  3. En la lista de columnas de la parte derecha, seleccione las que desee analizar. Debe incluir una columna que tenga un ID único.

  4. Haga clic en Agregar paso junto a su paso de datos y, a continuación, en Análisis de similitud.

  5. Seleccione el modelo que utilizar y, a continuación, haga clic en Aceptar.

  6. Amplíe la sección Salidas y seleccione Profile_expression.
    De esta forma se agrega una columna de salida concatenada de todos los datos seleccionados.
  7. Amplíe la sección Parámetros.

  8. Configure los parámetros:
    • Origen: haga clic en Seleccione un valor y, a continuación, elija la columna y el valor de datos para identificar de forma única el registro que desea comparar con otros del juego de datos. Por ejemplo, podría especificar el ID y seleccionar un paciente con el ID "100002".
    • Superiores (más cercanos) o inferiores (más lejanos): seleccione "Superiores" para buscar los registros más similares o "Inferiores" para buscar los registros menos similares.
    • Número de resultados: especifique el número de registros coincidentes que se devolverán. Por ejemplo, seleccione "100" para buscar los 100 registros con mejor coincidencia con el registro de destino.
    • (Opcional) Columna de referencia 1, 2 y 3: especifique una columna o una combinación de columnas que identifiquen de forma única los registros con los que está comparando el valor de Origen. Por ejemplo, para los pacientes médicos, puede seleccionar "ID", "Edad" y "Medicación". No es necesario que realice una selección en las columnas de referencia.
    • Incluir columnas de referencia para creación de perfiles: seleccione No para excluir las columnas de referencia especificadas en Columna de referencia 1, 2 y 3 de la creación de perfiles, o bien Sí para incluirlas en la creación de perfiles.
  9. Haga clic en el signo + junto al nodo Análisis de similitud del diagrama y, a continuación, en Agregar paso y seleccione Guardar datos.
  10. Configure el paso Guardar datos:

    • Juego de datos: cambie el valor por defecto por un nombre más significativo. Por ejemplo, "Similarity Analysis Top 10".
    • Tabla: no cambie el valor por defecto. Oracle Analytics crea un nuevo valor cuando el flujo de datos se ejecuta en función del nombre de juego de datos especificado.
    • (Opcional) Agregación por defecto: cambie la agregación por defecto. Por ejemplo, puede cambiarla a Promedio.
  11. Haga clic en Guardar modelo y especifique el nombre del modelo de predicción generado.
  12. Haga clic en Guardar y especifique un nombre para el flujo de datos.
  13. Haga clic en Ejecutar para analizar los datos y generar un modelo predictivo.
Puede buscar el juego de datos que genera Oracle Analytics en el separador Juego de datos de la página Datos. Consulte Interpretación de los resultados de un modelo de análisis de similitud.