Interpretazione dei risultati di un modello di analisi di somiglianza

Quando si esegue un flusso dati per eseguire un'analisi di somiglianza, Oracle Analytics genera un data set contenente i risultati.

È possibile effettuare le azioni riportate di seguito.
  • Individuare il data set di output nella pagina Dati di Oracle Analytics. Cercare un data set con il nome specificato nel passo Salva dati nel flusso dati. Il data set contiene le stesse colonne di output elencate nella sezione Output del passo Analisi di somiglianza nel flusso dati.

    Colonne del data set generate dal modello di analisi di somiglianza:

    • source_value: restituisce la colonna con un singolo valore all'interno della colonna selezionata nel flusso dati come oggetto di origine. La distanza vettoriale viene misurata in base a questo valore rispetto a tutti gli altri valori in questa colonna.
    • source_reference_column1: restituisce il valore selezionato della colonna di riferimento (come impostato nelle proprietà del nodo del flusso dati) per i record che sono stati selezionati nei record di origine per l'analisi di somiglianza. Questo output consente di determinare il record di origine per il quale sono stati trovati i record più vicini o più lontani.
    • results_reference_column1, 2 e 3: restituisce il valore delle rispettive colonne di riferimento (come impostato nelle proprietà dei nodi del flusso dati) per i record identificati come più vicini o più lontani dall'analisi di somiglianza.
    • distance: la distanza calcolata tra il valore di origine e il record dei risultati. Cioè, quanto sono simili o diversi i dati in source_reference_col1, source_reference_col2 e source_reference_col3 rispetto a result_reference1, result_reference2 e result_reference3.
    • profile_expression: espressione concatenata di tutte le colonne utilizzate nel modello di analisi di somiglianza in una singola stringa. Queste sono le colonne per le quali i valori sono stati vettorializzati dal modello di incorporamento.

      Nota:

      Le colonne degli attributi selezionate fanno parte della stringa del profilo, mentre le misure nelle colonne delle metriche vengono innanzitutto classificate in modo dinamico in bin bassi, medi e alti in modo che vengano rappresentate correttamente nei vettori.
  • Creare una cartella di lavoro in base al data set di output generato dal flusso dati dell'analisi di somiglianza.
  • Creare le visualizzazioni per analizzare i risultati. Ad esempio: