No Oracle Analytics, pode executar uma análise de semelhança nos seus dados utilizando uma variedade de modelos de incorporação vetorial. A análise de semelhança permite-lhe medir o grau de semelhança entre dois ou mais objetos, conjuntos de dados, documentos ou padrões, com base em métricas ou critérios definidos.
Por exemplo, poderá pretender responder a perguntas como:
- Que pacientes apresentam sintomas semelhantes a um determinado paciente?
- Que clientes têm um perfil semelhante a um determinado cliente?
- Que reclamações de seguro têm um perfil semelhante a uma determinada reclamação de seguro?
Como é que funciona?
O Oracle Database V23ai ou posterior suporta a pesquisa de vetores e funções de SQL para calcular a distância entre vetores, que é utilizada para quantificar o grau de semelhança entre registos de dados. O Oracle Analytics utiliza a pesquisa de vetores em segundo plano para executar uma análise de semelhança nos conjuntos de dados.
Considerações sobre o Desempenho
O tempo de processamento para a análise de semelhança varia consoante:
- O número de linhas no seu conjunto de dados de origem.
- O número de colunas que seleciona para utilização no seu fluxo de dados. Tenha em consideração que nem todas as colunas no seu conjunto de dados de origem serão utilizadas no seu modelo de análise de semelhança. Recomendamos utilizar entre 10 e 15 colunas. A seleção de mais de 15 colunas pode afetar negativamente o desempenho do fluxo de dados que utiliza para aplicar o modelo.
- O número de ECPU alocadas à sua instância do Oracle Autonomous AI Lakehouse.
Os fluxos de dados têm um limite de tempo de 2,5 horas, o que determina a quantidade de dados que podem ser processados.