Interpretando Resultados de um Modelo de Análise de Similaridade

Quando você executa um fluxo de dados para executar uma análise de similaridade, o Oracle Analytics gera um conjunto de dados que contém os resultados.

Veja o que você pode fazer:
  • Localize o conjunto de dados de saída na página Dados do Oracle Analytics. Procure um conjunto de dados com o nome especificado na etapa Salvar Dados no fluxo de dados. O conjunto de dados contém as mesmas colunas de saída listadas na seção Saídas da etapa Análise de Similaridade em seu fluxo de dados.

    Colunas do conjunto de dados geradas pelo modelo de análise de similaridade:

    • source_value - Retorna a coluna com um único valor dentro dessa coluna que foi selecionada no fluxo de dados como o objeto de origem. A distância vetorial é medida por este valor em relação a todos os outros valores nesta coluna.
    • source_reference_column1 - Retorna o valor selecionado da coluna de referência (conforme definido nas propriedades do nó do fluxo de dados) para registros que foram selecionados nos registros de origem para análise de similaridade. Essa saída ajudará você agora a saber qual é o registro de origem para o qual você encontrou os registros mais próximos ou mais distantes.
    • results_reference_column1, 2 e 3 - Retorna o valor das respectivas colunas de referência (conforme definido nas propriedades do nó do fluxo de dados) para registros que foram identificados como mais próximos ou mais distantes por análise de similaridade.
    • distância - A distância calculada entre o valor de origem e o registro do resultado. Ou seja, o quão semelhantes ou diferentes são os dados em source_reference_col1, source_reference_col2 e source_reference_col3 para result_reference1, result_reference2 e result_reference3.
    • profile_expression - A expressão concatenada de todas as colunas usadas em seu modelo de análise de similaridade em uma única string. Estas são as colunas cujos valores foram vetorizados pelo modelo de incorporação.

      Nota:

      As colunas de atributos que você selecionou fazem parte da string de perfil, enquanto as medidas nas colunas de métrica são primeiro categorizadas dinamicamente em compartimentos baixo, médio e alto para que sejam representadas corretamente nos vetores.
  • Crie uma pasta de trabalho com base no conjunto de dados de saída gerado pelo seu fluxo de dados de análise de similaridade.
  • Crie visualizações para analisar os resultados. Por exemplo: