Utilizaţi un flux de date pentru a aplica o analiză a similarităţilor din datele dvs., care vă permite să identificaţi înregistrările similare cu o anumită înregistrare dată.
- În pagina dvs. home, faceţi clic pe Creare, apoi pe Flux de date.
- În Adăugare date, selectaţi un set de date, apoi faceţi clic pe Adăugare.
Trebuie să utilizaţi Oracle Database sau Oracle Autonomous AI Lakehouse V23ai sau o versiune mai nouă.
- În lista de coloane, deselectaţi coloanele pe care nu doriţi să le analizaţi (în mod prestabilit, sunt selectate toate). Trebuie să includeţi o coloană cu un ID unic. Vă recomandăm să selectaţi între 10 şi 15 coloane. Dacă selectaţi mai mult de 15 coloane, performanţa ar putea fi afectată negativ.
- Treceţi cursorul peste nodul setului de date şi selectaţi Adăugaţi un pas, iar apoi faceţi clic pe Analiza similarităţilor.
- Selectaţi un model de utilizat, apoi faceţi clic pe OK.
- Extindeţi secţiunea Rezultate şi selectaţi Profile_expression.
Acest lucru adaugă o coloană de rezultate concatenat, cu toate datele selectate.
- Extindeţi secţiunea Parametri.
- Configuraţi parametrii:
- Sursă - Faceţi clic pe Selectaţi o valoare, apoi selectaţi coloana de date şi valoarea pentru a identifica în mod unic înregistrarea pe care doriţi să o comparaţi cu altele din setul de date. De exemplu, puteţi specifica ID-ul şi selecta un pacient cu ID-ul "100002".
- Sus (cel mai apropiat) sau Jos (cel mai îndepărtat) - Selectaţi "Sus" pt. a găsi înregistrările cele mai similare sau "Sus" pt. a găsi înregistrările cele mai puţin similare.
- Nr. de rezultate - Specificaţi numărul de înregistrări corespondente de returnat. De exemplu, selectaţi "100" pentru a găsi primele 100 de înregistrări care corespund cel mai bine cu înregistrarea vizată.
- (Opţional) Referinţă coloana 1, 2 şi 3 - Specificaţi o coloană sau o combinaţie de coloane care să identifice în mod unic înregistrările cu care comparaţi valoarea sursă. De exemplu, pentru pacienţii medicali, puteţi selecta "ID", "vârstă" şi "Medicaţie". Nu trebuie să efectuaţi o selecţie în coloanele de referinţă.
- Includere coloane de referinţă pentru profilare - Selectaţi Nu pentru a exclude coloanele de referinţă specificate în Referinţă coloana 1, 2 şi 3 din profilare sau Da pentru a le include în profilare.
- Faceţi clic pe + în dreptul nodului Analiză de similitudine din diagramă, apoi faceţi clic pe Adăugare pas şi selectaţi Salvare date.
- Configuraţi pasul Salvare date:
- Set de date - Modificaţi valoarea prestabilită la un nume mai care să aibă sens. De exemplu, "Analiză de similitudine - Top 10".
- Tabel - Nu modificaţi valoarea prestabilită. Oracle Analytics creează o valoare nouă atunci când fluxul de date rulează pe baza numelui setului de date specificat.
- (Opţional) Agregare prestabilită - Modificaţi agregarea prestabilită. De exemplu, o puteţi modifica la Medie.
- Faceţi clic pe Salvare model şi specificaţi numele modelului de predicţie generat.
- Faceţi clic pe Salvare şi specificaţi un nume pentru fluxul de date.
- Faceţi clic pe Rulare pentru a analiza datele şi a genera un model predictiv.