En Oracle Analytics, puede realizar análisis de similitud en los datos con distintos modelos de incrustación vectorial. El análisis de similitud le permite medir la similitud entre son dos o más objetos, juegos de datos, documentos o patrones, en función de criterios o métricas definidos.
Por ejemplo, tal vez desee responder preguntas como:
- ¿Qué pacientes tienen síntomas similares a los de un determinado paciente?
- ¿Qué clientes tienen un perfil similar al de un determinado cliente?
- ¿Qué siniestros tienen un perfil similar al de un siniestro concreto?
¿Cómo funciona?
Oracle Database V23ai y versiones posteriores soportan la búsqueda de vectores y las funciones SQL para calcular la distancia entre vectores, lo que permite cuantificar el grado de similitud entre registros de datos. Oracle Analytics utiliza la búsqueda de vectores en segundo plano para llevar a cabo análisis de similitud en los juegos de datos.
Consideraciones sobre el rendimiento
El tiempo de procesamiento del análisis de similitud varía según:
- El número de filas del juego de datos de origen.
- El número de columnas que decida utilizar en el flujo de datos. Tenga en cuenta que no se utilizarán todas las columnas del juego de datos de origen en el modelo de análisis de similitud. Se recomienda utilizar entre 10 y 15 columnas. La selección de más de 15 columnas puede afectar negativamente al rendimiento del flujo de datos que utilice para aplicar el modelo.
- Número de ECPU asignadas a la instancia de Oracle Autonomous AI Lakehouse.
Los flujos de datos tienen un límite de timeout de 2,5 horas, que determina la cantidad de datos que se pueden procesar.