Prehľad vykonávania analýzy podobnosti v službe Oracle Analytics

V službe Oracle Analytics môžete vykonávať analýzu podobnosti dát pomocou rôznych modelov vektorového vnorenia. Analýza podobnosti umožňuje merať, ako sú podobné dva alebo viaceré objekty, množiny dát, dokumenty alebo vzory na základe definovaných kritérií alebo metrík.

Môžete napríklad odpovedať na otázky typu:
  • Ktorí pacienti majú podobné príznaky ako daný pacient?
  • Ktorí zákazníci majú podobný profil ako daný zákazník?
  • Ktoré poistné nároky majú podobný profil ako daný poistný nárok?

Ako to funguje?

Databáza Oracle Database V23ai alebo novšia podporuje vektorové vyhľadávanie a funkcie SQL na výpočet vzdialenosti medzi vektormi, ktorá sa používa na kvantifikáciu stupňa podobnosti medzi dátovými záznamami. Oracle Analytics pomocou vektorového vyhľadávania na pozadí vykonáva analýzu podobnosti množín dát.

Aspekty výkonu

Trvanie analýzy podobnosti sa líši v závislosti od týchto faktorov:
  • Počet riadkov v zdrojovej množine dát.
  • Počet stĺpcov vybraných na použitie v dátovom toku. Upozorňujeme, že v modeli analýzy podobnosti sa nepoužijú všetky stĺpce zo zdrojovej množiny dát. Odporúčame použiť 10 až 15 stĺpcov. Výber viac ako 15 stĺpcov môže nepriaznivo ovplyvniť výkon dátového toku, ktorý používate na aplikovanie modelu.
  • Počet jednotiek ECPU pridelených vašej inštancii databázy Oracle Autonomous AI Lakehouse.

Dátové toky majú časový limit 2,5 hodiny, ktorý určuje množstvo dát, ktoré možno spracovať.