Interpretace výsledků z modelu analýzy podobnosti

Když spustíte datový tok k provedení analýzy podobnosti, služba Oracle Analytics generuje datovou sadu obsahující výsledky.

Postupy:
  • Vyhledejte výstupní datovou sadu na stránce Data služby Oracle Analytics. Vyhledejte datovou sadu s názvem zadaným v kroku Uložit data v datovém toku. Datová sada obsahuje stejné výstupní sloupce, které jsou uvedeny v části Výstupy kroku Analýza podobnosti v toku dat.

    Sloupce datové sady generované modelem analýzy podobnosti:

    • source_value – Vrátí sloupec s jedinou hodnotou v tomto sloupci, který byl vybrán v datovém toku jako zdrojový objekt. Vzdálenost vektoru se měří pomocí této hodnoty vůči všem ostatním hodnotám v tomto sloupci.
    • source_reference_column1 – Vrátí vybranou hodnotu referenčního sloupce (jak je nastavena ve vlastnostech uzlu datového toku) pro záznamy, které byly vybrány ve zdrojových záznamech pro analýzu podobnosti. Tento výstup vám pomůže zjistit, jaký je zdrojový záznam, pro který jste našli nejbližší nebo nejvzdálenější záznamy.
    • results_reference_column1, 2 a 3 – Vrátí hodnotu příslušných referenčních sloupců (jak je nastaveno ve vlastnostech uzlu datového toku) pro záznamy, které byly identifikovány analýzou podobnosti jako nejblíže nebo nejdále.
    • distance – Vypočtená vzdálenost mezi zdrojovou hodnotou a záznamem výsledku. To znamená, jak podobná nebo odlišná jsou data v source_reference_col1, source_reference_col2 a source_reference_col3 oproti result_reference1, result_reference2 a result_reference3.
    • profile_expression – Zřetězený výraz všech sloupců použitých v modelu analýzy podobnosti na jeden řetězec. Jedná se o sloupce, pro které byly hodnoty vektorovány vloženým modelem.

      Poznámka:

      Sloupce atributů, které jste vybrali, jsou součástí řetězce profilu, zatímco ukazatele ve sloupcích metrik jsou nejprve dynamicky rozděleny do nízkých, středních a vysokých zásobníků, aby byly ve vektorech správně zastoupeny.
  • Vytvoření sešitu založeného na výstupní datové sadě generované datovým tokem analýzy podobnosti.
  • Vytvoření vizualizací pro analýzu výsledků. Například: