Hasonlóságelemzési modell eredményeinek értelmezése

Amikor hasonlósági elemzés végrehajtásához futtat egy adatfolyamot, az Oracle Analytics létrehoz egy adatkészletet, amely tartalmazza az eredményeket.

Az alábbiakat teheti:
  • Keresse meg a kimeneti adatkészletet az Oracle Analytics Adatok oldalán. Keressen egy adatkészletet az adatfolyam Adatok mentése lépésében megadott névvel. Az adatkészlet ugyanazokat a kimeneti oszlopokat tartalmazza, amelyek szerepelnek az adatfolyam Hasonlóságelemzés lépésének Kimenetek szakaszában.

    A hasonlóságelemzési modell által létrehozott adatkészletoszlopok:

    • source_value – Olyan oszlopot ad vissza, amelynek egyetlen értéke van abban az oszlopban, amelyet az adatfolyamban forrásobjektumként jelöltek ki. A vektortávolságot ezzel az értékkel mérjük az oszlop összes többi értékével szemben.
    • source_reference_column1 – A hivatkozási oszlop kijelölt értékét adja vissza (az adatfolyam-csomópont tulajdonságaiban beállított módon) a forrásrekordoknál a hasonlóságelemzéshez kiválasztott rekordokhoz. Ez a kimenet segít abban, hogy most mi a forrásrekord, amelyhez a legközelebbi vagy legtávolabbi rekordokat találta.
    • results_reference_column1, 2 és 3 – A megfelelő hivatkozási oszlopok értékét adja vissza (az adatfolyam-csomópont tulajdonságaiban beállított módon) a hasonlóságelemzés által a legközelebbiként vagy a legtávolabbiként azonosított rekordokhoz.
    • distance - A forrásérték és az eredményrekord közötti számított távolság. Vagyis mennyire hasonlóak vagy különböznek az adatok a source_reference_col1, source_reference_col2 és source_reference_col3 és result_reference1, result_reference2 és result_reference3 között.
    • profile_expression – A hasonlóságelemzési modellben használt összes oszlop összefűzött kifejezése egyetlen karakterláncba. Ezek azok az oszlopok, amelyekhez az értékeket a beágyazási modell vektorizálja.

      Megjegyzés:

      A kijelölt attribútumoszlopok a profilkarakterlánc részei, míg a mutatószámoszlopokban lévő mérőszámok először dinamikusan vannak kategorizálva alacsony, közepes és magas tárolókba, így megfelelően jelennek meg a vektorokban.
  • Munkafüzet létrehozása a hasonlóságelemzési adatfolyam által létrehozott kimeneti adatkészlet alapján.
  • Megjelenítések létrehozása az eredmények elemzéséhez. Például: