În Oracle Analytics, puteţi efectua analize ale similarităţilor din datele dvs. utilizând o varietate de modele de înglobare vectorială. Analiza similarităţilor vă permite să măsuraţi cât de asemănătoare (similare) sunt două sau mai multe obiecte, seturi de date, documente sau tipare, pe baza unor criterii sau metrici definite.
De exemplu, puteţi răspunde la întrebări precum:
- Ce pacienţi au simptome similare cu un anumit pacient?
- Ce clienţi au un profil similar cu un anumit client?
- Ce revendicări de asigurare sunt similare în profil cu o anumită revendicare de asigurare?
Cum funcţionează?
Oracle Database V23ai sau o versiune mai nouă acceptă funcţiile SQL şi de căutare vectorială pentru a calcula distanţa dintre vectori, care este utilizată pentru a cuantifica gradul de asemănare dintre înregistrările de date. Oracle Analytics utilizează căutarea vectorială în culise pentru a efectua analize ale similarităţilor din seturile de date.
Consideraţii de performanţă
Durata de procesare pentru analiza similarităţii variază în funcţie de:
- Numărul de rânduri din setul dvs. de date sursă.
- Numărul de coloane pe care le selectaţi pentru a fi utilizate în fluxul dvs. de date. Reţineţi că nu toate coloanele din setul dvs. de date sursă vor fi utilizate în modelul dvs. de analiză a similarităţilor. Vă recomandăm să utilizaţi între 10 şi 15 coloane. Dacă selectaţi mai mult de 15 coloane, performanţa fluxului de date pe care-l utilizaţi pentru a aplica modelul ar putea fi afectată negativ.
- Numărul de nuclee ECPU alocate instanţei dvs. Oracle Autonomous AI Lakehouse.
Fluxurile de date au o limită de expirare de 2,5 ore, ceea ce dictează cantitatea de date care pot fi procesate.