Interpretowanie wyników z modelu analizy podobieństwa

Gdy przepływ danych jest uruchamiany w celu wykonania analizy podobieństwa, Oracle Analytics generuje zbiór danych zawierający wyniki.

Poniżej opisano, co można zrobić:

Zlokalizować wyjściowy zbiór danych na stronie "Dane Oracle Analytics". Wyszukać zbiór danych o nazwie określonej na etapie Zapisywanie danych w przepływie danych. Zbiór danych zawiera te same kolumny wyjściowe, które wymieniono w sekcji Dane wyjściowe etapu "Analiza podobieństwa" w przepływie danych.

.png"

Kolumny zbioru danych wygenerowane przez model analizy podobieństwa:
- source_value - zwraca kolumnę z jedną wartością w obrębie tej kolumny, która została wybrana w przepływie danych jako obiekt źródłowy. Odległość wektora jest mierzona przez porównanie tej wartości ze wszystkimi innymi wartościami w tej kolumnie.
- source_reference_column1 - zwraca wybraną wartość kolumny referencyjnej (zgodnie z ustawieniami we właściwościach węzła przepływu danych) dla rekordów, które zostały wybrane spośród rekordów źródłowych do analizy podobieństwa. Te dane wyjściowe pomogą teraz ustalić, jaki jest rekord źródłowy, dla którego znaleziono najbliższe lub najdalsze rekordy.
- results_reference_column1, 2 i 3 - zwraca wartość odpowiednich kolumn referencyjnych (zgodnie z ustawieniami we właściwościach węzła przepływu danych) dla rekordów, które zostały zidentyfikowane jako najbliższe lub najdalsze w wyniku analizy podobieństwa.
- Odległość - obliczona odległość między wartością źródłową a rekordem wyniku. Czyli, jak podobne (lub jak różne) są dane w znajdujące się w kolumnach "source_reference_col1", "source_reference_col2" i "source_reference_col3" do danych znajdujących się w kolumnach "result_reference1", "result_reference2" i "result_reference3".
- profile_expression - połączone w jednym napisie wyrażenie wszystkich kolumn używanych w modelu analizy podobieństwa. Są to kolumny, dla których wartości zostały zwektoryzowane przez model osadzania.
  
  Uwaga:
  Kolumny atrybutów wybrane przez użytkownika są częścią napisu profilu, podczas gdy miary w kolumnach miar są najpierw dynamicznie kategoryzowane w pojemnikach "Niskie", "Średnie" i "Wysokie", dzięki czemu będą poprawnie reprezentowane wektorach.
Utworzyć skoroszyt na podstawie wyjściowego zbioru danych wygenerowanego przez przepływ danych analizy podobieństwa.
Utworzyć wizualizacje w celu analizowania wyników. Na przykład:

.png"

Wskazówka: aby uzyskać rozszerzone wizualizacje i spostrzeżenia, należy dodać pierwotny zbiór danych i wykonać złączenie z danymi wyjściowymi modelu przy użyciu ID elementu. Zapewni to dodatkowy poziom szczegółowości przy mierzeniu odległości wektora od niektórych pierwotnych atrybutów zbioru danych.