Interpretarea rezultatelor dintr-un model de analiză a similitudinii

Când rulaţi un flux de date pentru a efectua analiza similarităţilor, Oracle Analytics generează un set de date care conţine rezultatele.

Iată ce puteţi face:
  • Găsiţi setul de date rezultat în pagina Date Oracle Analytics. Căutaţi un set de date cu numele specificat în pasul Salvare date din fluxul de date. Setul de date conţine aceleaşi coloane de rezultate listate în secţiunea Rezultate a pasului Analiza similarităţilor din fluxul dvs. de date.

    Coloanele cu seturi de date generate de modelul de analiză a similarităţilor:

    • source_value - Returnează coloana cu o singură valoare din coloana respectivă, care a fost selectată în fluxul de date ca obiect sursă. Distanţa vectorială este măsurată prin această valoare în raport cu toate celelalte valori din această coloană.
    • source_reference_column1 - Returnează valoarea selectată a coloanei de referinţă (aşa cum este setată în proprietăţile nodului fluxului de date) pentru înregistrările care au fost selectate în înregistrările sursă pentru analiza similarităţilor. Acest rezultat vă va ajuta să ştiţi care este înregistrarea sursă pentru care aţi găsit cele mai apropiate sau mai îndepărtate înregistrări.
    • source_reference_column1, 2 şi 3 - Returnează valoarea coloanelor de referinţă respective (aşa cum este setată în proprietăţile nodului fluxului de date) pentru înregistrările care au fost identificate de analiza similarităţilor drept cele mai apropiate sau mai îndepărtate.
    • distance - Distanţa calculată între valoarea sursă şi înregistrarea rezultatului. Cu alte cuvinte, cât de similare sau diferite sunt datele din source_reference_col1, source_reference_col2 şi source_reference_col3 faţă de result_reference1, result_reference2 şi result_reference3.
    • profile_expression - Expresia concatenată a tuturor coloanelor utilizate în modelul dvs. de analiză a similarităţilor într-un singur şir. Acestea sunt coloanele pt. care valorile au fost vectorizate de modelul de înglobare.

      Notă:

      Coloanele de atribute pe care le-aţi selectat fac parte din şirul de profil, în timp ce subindicatorii din coloanele de metrici sunt mai întâi clasificaţi dinamic în regiuni cu valori mici, cu valori medii şi cu valori mari, astfel încât să fie reprezentaţi corespunzător în vectori.
  • Creaţi un registru de lucru pe baza setului de date rezultat generat de fluxul de date pentru analiza similarităţilor.
  • Creaţi vizualizări pentru a analiza rezultatele. De exemplu: