Hasonlósági elemzés végrehajtásának áttekintése az Oracle Analytics szolgáltatásban

Az Oracle Analytics szolgáltatásban különböző vektorbeágyazási modellekkel végezhet hasonlósági elemzést az adatokon. A Hasonlósági elemzés lehetővé teszi annak mérését, hogy két vagy több objektum, adatkészlet, dokumentum vagy minta mennyire egyforma (hasonló) a definiált feltételek vagy mérőszámok alapján.

Például a következő kérdésekre adhat választ:
  • Mely betegek rendelkeznek hasonló tünetekkel egy adott beteghez?
  • Mely vevők rendelkeznek hasonló profillal egy adott vevőhöz?
  • Mely biztosítási igények hasonlóak egy adott biztosítási igényhez?

Hogyan működik?

Az Oracle Database V23ai támogatja a vektoros keresést és az SQL-függvényeket a vektorok közötti távolság kiszámításához, amely az adatrekordok közötti hasonlóság mértékének meghatározására szolgál. Az Oracle Analytics vektoros keresést használ a háttérben, hogy hasonlósági elemzést végezzen az adatkészleteken.

Teljesítménnyel kapcsolatos szempontok

A hasonlóságelemzés feldolgozási ideje a következőktől függ:
  • A forrásadatkészlet sorainak száma.
  • Az adatfolyamban használni kívánt oszlopok száma. Ügyeljen arra, hogy a forrásadatkészlet nem minden oszlopát használja a rendszer a hasonlóságelemzési modellben. 10-15 oszlop használatát javasoljuk. Ha több mint 15 oszlopot jelöl ki, az hátrányosan befolyásolhatja a modell alkalmazásához használt adatfolyam teljesítményét.
  • Az Oracle Autonomous AI Lakehouse példányhoz lefoglalt ECPU egységek száma.

Az adatfolyamok időkorlátja 2,5 óra, ami meghatározza a feldolgozható adatok mennyiségét.