Aplicaţi asupra datelor dvs. un model de analiză a similarităţilor

Utilizaţi un flux de date pentru a aplica un model de înglobare a vectorilor la un set de date, pentru a efectua o analiză a similarităţilor, care identifică înregistrările similare cu o înregistrare dată.

Înainte de a începe, asiguraţi-vă că aveţi cerinţele preliminare pentru efectuarea acestui tip de analiză. Consultaţi Cerinţe preliminare pentru efectuarea analizei similarităţilor în Oracle Analytics.
  1. În pagina home, faceţi clic pe Creare, apoi faceţi clic pe Flux de date.
  2. În Adăugare date, selectaţi setul de date care conţine datele pe care doriţi să le analizaţi, apoi faceţi clic pe Adăugare.
    Setul dvs. de date trebuie să se bazeze pe Oracle Database sau pe Oracle Autonomous Data Warehouse.
  3. În lista de coloane din partea dreaptă, selectaţi coloanele pe care doriţi să le analizaţi. Trebuie să includeţi o coloană cu un ID unic.

  4. Faceţi clic pe Adăugaţi un pas în dreptul pasului dvs. de date, apoi faceţi clic pe Analiza similarităţilor.

  5. Selectaţi un model de utilizat, apoi faceţi clic pe OK.

  6. Extindeţi secţiunea Rezultate şi selectaţi Profile_expression.
    Acest lucru adaugă o coloană de rezultate concatenat, cu toate datele selectate.
  7. Extindeţi secţiunea Parametri.

  8. Configuraţi parametrii:
    • Sursă - Faceţi clic pe Selectaţi o valoare, apoi selectaţi coloana de date şi valoarea pentru a identifica în mod unic înregistrarea pe care doriţi să o comparaţi cu altele din setul de date. De exemplu, puteţi specifica ID-ul şi selecta un pacient cu ID-ul "100002".
    • Sus (cel mai apropiat) sau Jos (cel mai îndepărtat) - Selectaţi "Sus" pt. a găsi înregistrările cele mai similare sau "Sus" pt. a găsi înregistrările cele mai puţin similare.
    • Nr. de rezultate - Specificaţi numărul de înregistrări corespondente de returnat. De exemplu, selectaţi "100" pentru a găsi primele 100 de înregistrări care corespund cel mai bine cu înregistrarea vizată.
    • (Opţional) Referinţă coloana 1, 2 şi 3 - Specificaţi o coloană sau o combinaţie de coloane care să identifice în mod unic înregistrările cu care comparaţi valoarea sursă. De exemplu, pentru pacienţii medicali, puteţi selecta "ID", "vârstă" şi "Medicaţie". Nu trebuie să efectuaţi o selecţie în coloanele de referinţă.
    • Includere coloane de referinţă pentru profilare - Selectaţi Nu pentru a exclude coloanele de referinţă specificate în Referinţă coloana 1, 2 şi 3 din profilare sau Da pentru a le include în profilare.
  9. Faceţi clic pe + în dreptul nodului Analiză de similitudine din diagramă, apoi faceţi clic pe Adăugare pas şi selectaţi Salvare date.
  10. Configuraţi pasul Salvare date:

    • Set de date - Modificaţi valoarea prestabilită la un nume mai care să aibă sens. De exemplu, "Analiză de similitudine - Top 10".
    • Tabel - Nu modificaţi valoarea prestabilită. Oracle Analytics creează o valoare nouă atunci când fluxul de date rulează pe baza numelui setului de date specificat.
    • (Opţional) Agregare prestabilită - Modificaţi agregarea prestabilită. De exemplu, o puteţi modifica la Medie.
  11. Faceţi clic pe Salvare model şi specificaţi numele modelului de predicţie generat.
  12. Faceţi clic pe Salvare şi specificaţi un nume pentru fluxul de date.
  13. Faceţi clic pe Rulare pentru a analiza datele şi a genera un model predictiv.
Puteţi găsi setul de date pe care îl generează Oracle Analytics în fila Set de date din pagina Date. Consultaţi Interpretarea rezultatelor dintr-un model de analiză a similitudinii.