Primjena modela analize sličnosti na podatke

Upotrijebite tijek podataka za primjenu analize sličnosti na podatke, što vam omogućuje da identificirate zapise koji su slični danom zapisu.

Prije početka provjerite imate li preduvjete za izvođenje ove vrste analize. Pogledajte Preduvjeti za izvršavanje analiza sličnosti u servisu Oracle Analytics.
  1. Na početnoj stranici pritisnite Stvori i pritisnite Tijek podataka.
  2. U dijaloškom okviru Dodavanje podataka odaberite skup podataka i zatim pritisnite Dodaj.

    Morate upotrebljavati Oracle Database ili Oracle Autonomous AI Lakehouse V23ai ili novije verzije.

  3. Na popisu stupaca poništite odabir stupaca koje ne želite analizirati (svi su odabrani prema zadanim postavkama). Morate uključiti stupac s jedinstvenim ID-om. Preporučujemo odabir između 10 i 15 stupaca. Odabir više od 15 stupaca može negativno utjecati na izvedbu.

  4. Zadržite pokazivač iznad čvora skupa podataka i odaberite Dodaj korak i zatim pritisnite Analiza sličnosti.

  5. Odaberite model koji želite upotrijebiti i pritisnite U redu.

  6. Proširite odjeljak Izlazi i odaberite Profile_expression.
    Time se dodaje ulančani izlazni stupac svih odabranih podataka.
  7. Proširite odjeljak Parametri.

  8. Konfiguriranje parametara:
    • Izvor – pritisnite Odaberi vrijednost, a zatim odaberite stupac s podacima i vrijednost za jedinstvenu identifikaciju zapisa koji želite usporediti s drugima u skupu podataka. Možete, na primjer, navesti ID i odabrati pacijenta s ID-om "100002".
    • Vrh (najbliži) ili Dno (najdalji) - odaberite "Vrh" kako biste pronašli najsličnije zapise ili "Dno" kako biste pronašli najmanje slične zapise.
    • Broj rezultata – definirajte broj odgovarajućih zapisa koji možete dobiti. Npr., odaberite "100" kako biste pronašli 100 najviše rangiranih odgovarajućih zapisa najbližih odredišnom zapisu.
    • (Po izboru) Referentni stupac1, 2 i 3 - definirajte stupac ili kombinaciju stupaca koji će na jedinstven način identificirati zapise s kojima uspoređujete vrijednost Izvor. Na primjer, za medicinske pacijente možete odabrati "ID", "Dob" i "Lijekovi". Ne trebate izvršiti odabir u referentnim stupcima.
    • Uključi referentne stupce za profiliranje - odaberite Ne kako biste iz profiliranja isključili referentne stupce definirane u izborniku Referentni stupac 1, 2 i 3 ili Da kako biste ih uključili u profiliranje.
  9. Pritisnite + uz čvor Analiza sličnosti u dijagramu, a zatim pritisnite Dodaj korak i odaberite Spremi podatke.
  10. Konfigurirajte korak Spremi podatke:

    • Skup podataka – zadanu vrijednost promijenite na smisleniji naziv. Na primjer, "Analiza sličnosti - 10 najviše rangiranih".
    • Tablica - nemojte mijenjati zadanu vrijednost. Oracle Analytics stvara novu vrijednost kad se tijek podataka pokrene na temelju definiranog naziva Skup podataka.
    • (Po izboru) Zadano sabiranje - promijenite zadano sabiranje. Možete ga, na primjer, promijeniti u Prosjek.
  11. Pritisnite Spremi model, i navedite naziv generiranog prediktivnog modela.
  12. Pritisnite Spremi i navedite naziv tijeka podataka.
  13. Pritisnite Pokreni za analizu podataka i generiranje prediktivnog modela.
Možete pronaći skup podataka koji će Oracle Analytics generirati u kartici Skup podataka na stranici Podaci. Pogledajte Tumačenje rezultata iz modela analize sličnosti.