Aplicaţi asupra datelor dvs. un model de analiză a similarităţilor

Utilizaţi un flux de date pentru a aplica o analiză a similarităţilor din datele dvs., care vă permite să identificaţi înregistrările similare cu o anumită înregistrare dată.

Înainte de a începe, asiguraţi-vă că aveţi cerinţele preliminare pentru efectuarea acestui tip de analiză. Consultaţi Cerinţe preliminare pentru efectuarea analizei similarităţilor în Oracle Analytics.
  1. În pagina dvs. home, faceţi clic pe Creare, apoi pe Flux de date.
  2. În Adăugare date, selectaţi un set de date, apoi faceţi clic pe Adăugare.

    Trebuie să utilizaţi Oracle Database sau Oracle Autonomous AI Lakehouse V23ai sau o versiune mai nouă.

  3. În lista de coloane, deselectaţi coloanele pe care nu doriţi să le analizaţi (în mod prestabilit, sunt selectate toate). Trebuie să includeţi o coloană cu un ID unic. Vă recomandăm să selectaţi între 10 şi 15 coloane. Dacă selectaţi mai mult de 15 coloane, performanţa ar putea fi afectată negativ.

  4. Treceţi cursorul peste nodul setului de date şi selectaţi Adăugaţi un pas, iar apoi faceţi clic pe Analiza similarităţilor.

  5. Selectaţi un model de utilizat, apoi faceţi clic pe OK.

  6. Extindeţi secţiunea Rezultate şi selectaţi Profile_expression.
    Acest lucru adaugă o coloană de rezultate concatenat, cu toate datele selectate.
  7. Extindeţi secţiunea Parametri.

  8. Configuraţi parametrii:
    • Sursă - Faceţi clic pe Selectaţi o valoare, apoi selectaţi coloana de date şi valoarea pentru a identifica în mod unic înregistrarea pe care doriţi să o comparaţi cu altele din setul de date. De exemplu, puteţi specifica ID-ul şi selecta un pacient cu ID-ul "100002".
    • Sus (cel mai apropiat) sau Jos (cel mai îndepărtat) - Selectaţi "Sus" pt. a găsi înregistrările cele mai similare sau "Sus" pt. a găsi înregistrările cele mai puţin similare.
    • Nr. de rezultate - Specificaţi numărul de înregistrări corespondente de returnat. De exemplu, selectaţi "100" pentru a găsi primele 100 de înregistrări care corespund cel mai bine cu înregistrarea vizată.
    • (Opţional) Referinţă coloana 1, 2 şi 3 - Specificaţi o coloană sau o combinaţie de coloane care să identifice în mod unic înregistrările cu care comparaţi valoarea sursă. De exemplu, pentru pacienţii medicali, puteţi selecta "ID", "vârstă" şi "Medicaţie". Nu trebuie să efectuaţi o selecţie în coloanele de referinţă.
    • Includere coloane de referinţă pentru profilare - Selectaţi Nu pentru a exclude coloanele de referinţă specificate în Referinţă coloana 1, 2 şi 3 din profilare sau Da pentru a le include în profilare.
  9. Faceţi clic pe + în dreptul nodului Analiză de similitudine din diagramă, apoi faceţi clic pe Adăugare pas şi selectaţi Salvare date.
  10. Configuraţi pasul Salvare date:

    • Set de date - Modificaţi valoarea prestabilită la un nume mai care să aibă sens. De exemplu, "Analiză de similitudine - Top 10".
    • Tabel - Nu modificaţi valoarea prestabilită. Oracle Analytics creează o valoare nouă atunci când fluxul de date rulează pe baza numelui setului de date specificat.
    • (Opţional) Agregare prestabilită - Modificaţi agregarea prestabilită. De exemplu, o puteţi modifica la Medie.
  11. Faceţi clic pe Salvare model şi specificaţi numele modelului de predicţie generat.
  12. Faceţi clic pe Salvare şi specificaţi un nume pentru fluxul de date.
  13. Faceţi clic pe Rulare pentru a analiza datele şi a genera un model predictiv.
Puteţi găsi setul de date pe care îl generează Oracle Analytics în fila Set de date din pagina Date. Consultaţi Interpretarea rezultatelor dintr-un model de analiză a similitudinii.