Primjena modela analize sličnosti na podatke

Upotrijebite tijek podataka za primjenu modela ugrađivanja vektora na skup podataka kako biste izvršili analizu sličnosti, čime se identificiraju zapisi koji su slični danom zapisu.

Prije početka provjerite imate li preduvjete za izvođenje ove vrste analize. Pogledajte Preduvjeti za izvršavanje analiza sličnosti u servisu Oracle Analytics.
  1. Na početnoj stranici pritisnite Stvori, a zatim pritisnite Tijek podataka.
  2. U izborniku Dodaj podatke odaberite skup podataka koji sadrži podatke koje želite analizirati, a zatim pritisnite Dodaj.
    Vaš skup podataka mora se temeljiti na servisu Oracle Database ili Oracle Autonomous Data Warehouse.
  3. Na popisu stupaca s desne strane odaberite stupce koje želite analizirati. Morate uključiti stupac s jedinstvenim ID-om.

  4. Pritisnite Dodaj korak pokraj koraka podataka, a zatim pritisnite Analiza sličnosti.

  5. Odaberite model koji želite upotrijebiti i pritisnite U redu.

  6. Proširite odjeljak Izlazi i odaberite Profile_expression.
    Time se dodaje ulančani izlazni stupac svih odabranih podataka.
  7. Proširite odjeljak Parametri.

  8. Konfiguriranje parametara:
    • Izvor – pritisnite Odaberi vrijednost, a zatim odaberite stupac s podacima i vrijednost za jedinstvenu identifikaciju zapisa koji želite usporediti s drugima u skupu podataka. Možete, na primjer, navesti ID i odabrati pacijenta s ID-om "100002".
    • Vrh (najbliži) ili Dno (najdalji) - odaberite "Vrh" kako biste pronašli najsličnije zapise ili "Dno" kako biste pronašli najmanje slične zapise.
    • Broj rezultata – definirajte broj odgovarajućih zapisa koji možete dobiti. Npr., odaberite "100" kako biste pronašli 100 najviše rangiranih odgovarajućih zapisa najbližih odredišnom zapisu.
    • (Po izboru) Referentni stupac1, 2 i 3 - definirajte stupac ili kombinaciju stupaca koji će na jedinstven način identificirati zapise s kojima uspoređujete vrijednost Izvor. Na primjer, za medicinske pacijente možete odabrati "ID", "Dob" i "Lijekovi". Ne trebate izvršiti odabir u referentnim stupcima.
    • Uključi referentne stupce za profiliranje - odaberite Ne kako biste iz profiliranja isključili referentne stupce definirane u izborniku Referentni stupac 1, 2 i 3 ili Da kako biste ih uključili u profiliranje.
  9. Pritisnite + uz čvor Analiza sličnosti u dijagramu, a zatim pritisnite Dodaj korak i odaberite Spremi podatke.
  10. Konfigurirajte korak Spremi podatke:

    • Skup podataka – zadanu vrijednost promijenite na smisleniji naziv. Na primjer, "Analiza sličnosti - 10 najviše rangiranih".
    • Tablica - nemojte mijenjati zadanu vrijednost. Oracle Analytics stvara novu vrijednost kad se tijek podataka pokrene na temelju definiranog naziva Skup podataka.
    • (Po izboru) Zadano sabiranje - promijenite zadano sabiranje. Možete ga, na primjer, promijeniti u Prosjek.
  11. Pritisnite Spremi model, i navedite naziv generiranog prediktivnog modela.
  12. Pritisnite Spremi i navedite naziv tijeka podataka.
  13. Pritisnite Pokreni za analizu podataka i generiranje prediktivnog modela.
Možete pronaći skup podataka koji će Oracle Analytics generirati u kartici Skup podataka na stranici Podaci. Pogledajte Tumačenje rezultata iz modela analize sličnosti.