Visão Geral da Execução de Análise de Similaridade no Oracle Analytics

No Oracle Analytics, você pode executar análises de similaridade em seus dados usando uma variedade de modelos de incorporação vetorial. A análise de similaridade permite que você meça o quanto dois ou mais objetos, conjuntos de dados, documentos ou padrões são semelhantes, com base em critérios ou métricas definidos.

Por exemplo, talvez você queira responder a perguntas como:

Quais pacientes têm sintomas semelhantes a um determinado paciente?
Quais clientes têm um perfil semelhante a um determinado cliente?
Quais pedidos de indenização de seguro são semelhantes em perfil a um determinado pedido de indenização de seguro?

Como isso funciona?

O Oracle Database V23ai ou versão posterior suporta funções de pesquisa vetorial e SQL para calcular a distância entre vetores, que é usada para quantificar o grau de semelhança entre registros de dados. O Oracle Analytics usa a pesquisa vetorial nos bastidores para executar análises de similaridade em conjuntos de dados.

Considerações sobre Desempenho

O tempo de processamento da análise de similaridade varia de acordo com:

O número de linhas no conjunto de dados de origem.
O número de colunas que você seleciona para usar no fluxo de dados. Observe que nem todas as colunas do conjunto de dados de origem serão usadas no modelo de análise de similaridade. Recomendamos usar entre 10 e 15 colunas. A seleção de mais de 15 colunas pode afetar negativamente o desempenho do fluxo de dados usado para aplicar o modelo.
O número de ECPUs alocadas para sua instância do Oracle Autonomous AI Lakehouse.

Os fluxos de dados têm um limite de timeout de 2,5 horas, o que determina a quantidade de dados que podem ser processados.