Aplicar um Modelo de Análise de Similaridade aos Dados

Use um fluxo de dados para aplicar uma análise de similaridade aos seus dados, o que permite identificar registros semelhantes a um determinado registro.

Antes de começar, verifique se você tem os pré-requisitos para executar esse tipo de análise. Consulte Pré-Requisitos da Execução de Análise de Similaridade no Oracle Analytics.
  1. Na home page, clique em Criar e, em seguida, clique em Fluxo de Dados.
  2. Em Adicionar Dados, selecione um conjunto de dados e clique em Adicionar.

    Use um Oracle Database ou um Oracle Autonomous AI Lakehouse V23ai ou mais recente.

  3. Na lista de colunas, desmarque as colunas que você não deseja analisar (todas elas são todas selecionadas por padrão). Inclua uma coluna com um ID exclusivo. Recomendamos selecionar entre 10 e 15 colunas. A seleção de mais de 15 colunas pode afetar negativamente o desempenho.

  4. Passe o cursor do mouse sobre o nó do conjunto de dados e selecione Adicionar uma etapa. Em seguida, clique em Análise de Similaridade.

  5. Selecione um modelo a ser usado e clique em OK.

  6. Expanda a seção Saídas e selecione Profile_expression.
    Isso adiciona uma coluna de saída concatenada de todos os dados selecionados.
  7. Expanda a seção Parâmetros.

  8. Configure os parâmetros:
    • Origem - Clique em Selecionar um valor e selecione a coluna de dados e o valor para identificar exclusivamente o registro que você deseja comparar com outros no conjunto de dados. Por exemplo, você pode especificar o ID e selecionar um paciente com o ID "100002".
    • Superior (mais próximo) ou Inferior (mais próximo) - Selecione "Superior" para localizar os registros mais semelhantes, ou "Inferior" para localizar os registros menos semelhantes.
    • Número de Resultados - Especifique o número de registros correspondentes a serem retornados. Por exemplo, selecione "100" para localizar os 100 principais registros correspondentes mais próximos do seu registro de destino.
    • (Opcional) Referência Column1, 2 e 3 - Especifique uma coluna ou combinação de colunas que identifiquem exclusivamente os registros com os quais você está comparando o valor Origem. Por exemplo, para pacientes médicos, você pode selecionar "ID", "Idade" e "Medicação". Não é necessário fazer uma seleção em colunas de referência.
    • Incluir Colunas de Referência para Criação de Perfil - Escolha Não para excluir as colunas de referência especificadas em Referência Column1, 2 e 3 da criação de perfil ou Sim para incluí-las na criação de perfil.
  9. Clique em + ao lado do nó Análise de Similaridade no diagrama, clique em Adicionar etapa e selecione Salvar Dados.
  10. Configure a etapa Salvar Dados:

    • Conjunto de Dados - Altere o valor padrão para um nome mais significativo. Por exemplo, "Análise de Similaridade Top 10".
    • Tabela - Não altere o valor padrão. O Oracle Analytics cria um novo valor quando o fluxo de dados é executado com base no nome do Conjunto de Dados especificado.
    • (Opcional) Agregação Padrão - Altere a agregação padrão. Por exemplo, você pode alterá-lo para Média.
  11. Clique em Salvar Modelo e especifique o nome do modelo de previsão gerado.
  12. Clique em Salvar e especifique um nome para o fluxo de dados.
  13. Clique em Executar para analisar os dados e gerar um modelo preditivo.
Você pode localizar o conjunto de dados gerado pelo Oracle Analytics na guia Conjunto de Dados da página Dados. Consulte Interpretando Resultados de um Modelo de Análise de Similaridade.