Přehled provádění analýzy podobnosti v Oracle Analytics

Ve službě Oracle Analytics můžete provádět analýzu podobnosti dat pomocí různých modelů vektorového vkládání. Analýza podobnosti umožňuje měřit, jak podobné (stejné) jsou dva nebo více objektů, datových sad, dokumentů nebo vzorů na základě definovaných kritérií nebo metrik.

Můžete například chtít odpovědět na otázky, jako jsou:
  • Kteří pacienti mají podobné příznaky jako daný pacient?
  • Kteří zákazníci mají podobný profil jako daný zákazník?
  • Jaké pojistné nároky jsou podobné profilu dané pojistné události?

Jak to funguje?

Databáze Oracle V23ai a novější podporuje vektorové vyhledávání a funkce SQL pro výpočet vzdálenosti mezi vektory, která se používá ke kvantifikaci míry podobnosti mezi datovými záznamy. Oracle Analytics používá vektorové vyhledávání v pozadí k provádění analýzy podobnosti datových sad.

Parametry výkonu

Doba zpracování analýzy podobnosti se bude lišit v závislosti na:
  • Počtu řádků ve zdrojové datové sadě.
  • Počtu sloupců, které vyberete k použití v datovém toku. Upozorňujeme, že v modelu analýzy podobnosti nebudou použity všechny sloupce ze zdrojové datové sady. Doporučujeme použít 10 až 15 sloupců. Výběr více než 15 sloupců může negativně ovlivnit výkon toku dat, který používáte k aplikaci modelu.
  • Počet ECPU přidělených vaší instanci Oracle Autonomous AI Lakehouse.

Toky dat mají časový limit 2,5 hodiny, který určuje množství dat, která lze zpracovat.