Utilice un flujo de datos para aplicar un modelo de incrustación de vector a un juego de datos con el fin de realizar un análisis de similitud, donde se identifiquen los registros similares a un registro determinado.
- En la página inicial, haga clic en Crear y, a continuación, en Flujo de datos.
- En Agregar datos, seleccione el juego de datos que contiene los datos que desea analizar y, a continuación, haga clic en Agregar.
El juego de datos debe basarse en Oracle Database o en Oracle Autonomous Data Warehouse.
- En la lista de columnas de la parte derecha, seleccione las que desee analizar. Debe incluir una columna que tenga un ID único.
- Haga clic en Agregar paso junto a su paso de datos y, a continuación, en Análisis de similitud.
- Seleccione el modelo que utilizar y, a continuación, haga clic en Aceptar.
- Amplíe la sección Salidas y seleccione Profile_expression.
De esta forma se agrega una columna de salida concatenada de todos los datos seleccionados.
- Amplíe la sección Parámetros.
- Configure los parámetros:
- Origen: haga clic en Seleccione un valor y, a continuación, elija la columna y el valor de datos para identificar de forma única el registro que desea comparar con otros del juego de datos. Por ejemplo, podría especificar el ID y seleccionar un paciente con el ID "100002".
- Superiores (más cercanos) o inferiores (más lejanos): seleccione "Superiores" para buscar los registros más similares o "Inferiores" para buscar los registros menos similares.
- Número de resultados: especifique el número de registros coincidentes que se devolverán. Por ejemplo, seleccione "100" para buscar los 100 registros con mejor coincidencia con el registro de destino.
- (Opcional) Columna de referencia 1, 2 y 3: especifique una columna o una combinación de columnas que identifiquen de forma única los registros con los que está comparando el valor de Origen. Por ejemplo, para los pacientes médicos, puede seleccionar "ID", "Edad" y "Medicación". No es necesario que realice una selección en las columnas de referencia.
- Incluir columnas de referencia para creación de perfiles: seleccione No para excluir las columnas de referencia especificadas en Columna de referencia 1, 2 y 3 de la creación de perfiles, o bien Sí para incluirlas en la creación de perfiles.
- Haga clic en el signo + junto al nodo Análisis de similitud del diagrama y, a continuación, en Agregar paso y seleccione Guardar datos.
- Configure el paso Guardar datos:
- Juego de datos: cambie el valor por defecto por un nombre más significativo. Por ejemplo, "Similarity Analysis Top 10".
- Tabla: no cambie el valor por defecto. Oracle Analytics crea un nuevo valor cuando el flujo de datos se ejecuta en función del nombre de juego de datos especificado.
- (Opcional) Agregación por defecto: cambie la agregación por defecto. Por ejemplo, puede cambiarla a Promedio.
- Haga clic en Guardar modelo y especifique el nombre del modelo de predicción generado.
- Haga clic en Guardar y especifique un nombre para el flujo de datos.
- Haga clic en Ejecutar para analizar los datos y generar un modelo predictivo.