Zastosowanie modelu analizy podobieństwa do danych

Za pomocą przepływu danych można zastosować model osadzania wektora do zbioru danych w celu wykonania analizy podobieństwa, która identyfikuje rekordy podobne do danego rekordu.

Przed rozpoczęciem należy się upewnić, że zostały spełnione wymagania wstępne dotyczące wykonywania analizy tego typu. Zob. Wymagania wstępne dotyczące wykonywania analizy podobieństwa w Oracle Analytics.
  1. Na stronie startowej kliknąć Utwórz, po czym kliknąć Przepływ danych.
  2. W oknie dialogowym "Dodawanie danych" wybrać zbiór danych zawierający dane, które mają zostać przeanalizowane, a następnie kliknąć Dodaj.
    Postawą zbioru danych musi być baza danych Oracle Database lub Oracle Autonomous Data Warehouse.
  3. Z listy kolumn po prawej stronie wybrać kolumny, które mają zostać przeanalizowane. Należy uwzględnić kolumnę z unikatowym ID.

  4. Kliknąć Dodaj etap obok etapu danych, a następnie kliknąć Analiza podobieństwa.

  5. Wybrać model do użycia, a następnie kliknąć OK.

  6. Rozwinąć sekcję Dane wyjściowe, a następnie wybrać Profile_expression.
    Spowoduje to dodanie połączonej kolumny wyjściowej zawierającej wszystkie wybrane dane.
  7. Rozwinąć sekcję Parametry.

  8. Skonfigurować parametry:
    • Źródło - kliknąć Wybór wartości, a następnie wybrać kolumnę danych i wartość, aby jednoznacznie zidentyfikować rekord, który ma zostać porównany z innymi rekordami w zbiorze danych. Na przykład można określić wartość "ID" i wybrać pacjenta o ID "100002".
    • Pierwsze (najbliższe) lub Ostatnie (najdalsze) - wybrać opcję "Pierwsze", aby znaleźć najbardziej podobne rekordy, albo opcję "Ostatnie", aby znaleźć najmniej podobne rekordy.
    • Liczba wyników - określić liczbę zwracanych zgodnych rekordów. Na przykład należy wybrać wartość "100", aby znaleźć 100 pierwszych zgodnych rekordów najbliższych rekordowi docelowemu.
    • (Opcjonalnie) Kolumna referencyjna 1, 2 i 3 - określić kolumnę lub kombinację kolumn jednoznacznie identyfikujących rekordy, z którymi porównywana jest wartość Źródło. Na przykład w przypadku pacjentów medycznych można wybrać kolumny "ID", "Wiek" i "Lek". Nie trzeba dokonywać wyboru w kolumnach referencyjnych.
    • Uwzględnij kolumny referencyjne na potrzeby profilowania - należy wybrać wartość "Nie", aby wykluczyć z profilowania kolumny referencyjne określone w polu Kolumna referencyjna 1, 2 i 3, albo wartość "Tak", aby uwzględnić je w profilowaniu.
  9. Kliknąć + obok węzła Analiza podobieństwa na diagramie, a następnie kliknąć Dodaj etap i wybrać Zapisywanie danych.
  10. Skonfigurować etap "Zapisywanie danych":

    • Zbiór danych - wartość domyślną można zmienić na bardziej zrozumiałą nazwę. Na przykład "Analiza podobieństwa - 10 pierwszych".
    • Tabela - nie należy zmieniać wartości domyślnej. Oracle Analytics utworzy nową wartość, gdy przepływ danych zostanie uruchomiony na podstawie określonej nazwy zbioru danych.
    • (Opcjonalnie) Agregacja domyślna - można zmienić agregację domyślną. Na przykład można zmienić ją na "Średnia".
  11. Kliknąć Zapisz model, po czym określić nazwę generowanego modelu predykcyjnego.
  12. Kliknąć Zapisz, po czym określić nazwę przepływu danych.
  13. Kliknąć Uruchom, aby uruchomić analizę danych i wygenerować model predykcyjny.
Zbiór danych wygenerowany przez Oracle Analytics można znaleźć na karcie Zbiór danych na stronie Dane. Zob. Interpretowanie wyników z modelu analizy podobieństwa.