Adatbázis-elemző függvények

Az adatbázis-elemző függvények lehetővé teszik összetett elemzések és adatbányászati elemzések végrehajtását, például rendellenességek felderítése, adatok fürtözése, adatok mintavételezése és affinitáselemzés. Elemzési függvények használatához kapcsolódjon Oracle Database adatbázishoz vagy Oracle Autonomous AI Database adatbázishoz (az elemzések kiszámítása az adatbázisban történik, nem az Oracle Analytics szolgáltatásban).

LiveLabs Sprint

Az Adatbázis-elemzések lépés megjelenítéséhez az adatfolyam-szerkesztőben kapcsolódnia kell egy Oracle adatbázishoz vagy Oracle Autonomous AI Database adatbázishoz.

Függvénytípusok	Leírás
Rendellenességek dinamikus észlelése	Előre definiált modell nélkül észlelje a bemeneti adatok rendellenességeit. Például érdemes kiemelni a szokatlan pénzügyi tranzakciókat. Ha ezt a függvényt nagy adatkészletekkel alkalmazza, a maximális teljesítmény elérése érdekében konfigurálja a partícióoszlopokat.
Dinamikus fürtképzés	Előre definiált modell nélkül rendezze fürtbe a bemeneti adatait. Például érdemes lehet jellemezni és felfedezni ügyfélszegmenseket marketing célokból. Ha ezt a függvényt nagy adatkészletekkel alkalmazza, a maximális teljesítmény elérése érdekében konfigurálja a partícióoszlopokat.
Gyakori elemkészlet	Fedezze fel az adatai között lévő kapcsolatokat olyan elemkészletek azonosításával, amelyek gyakran együtt jelennek meg. Ez az adatbányászási módszer a következő neveken is ismert: társítási szabály tanulása, affinitáselemzés vagy a kiskereskedelmi iparágban mint a piaci kosár elemzése. Ha gyakori elemkészletet használ a piaci kosár elemzési eszközeként, arra a megállapításra juthat, hogy azok a vevők, akik sampont vásárolnak, hajkondicionálót is vesznek. Ez a művelet sok erőforrást igényel, és a végrehajtása számos tényezőtől függ. Ilyenek például a bemeneti adatkészlet mennyisége, a tranzakcióazonosító számossága, és az Elem értéke oszlop számossága. Az adatbázissal kapcsolatban lehetséges teljesítményromlás elkerüléséhez próbálkozzon a minimális támogatási százalék magasabb értékével (az alapértelmezett érték 0,25), és fokozatosan csökkentse, hogy több elemkészletet elhelyezhessen a kimenetében.
Adatok mintavételezése	Kiválaszt egy véletlenszerű mintaszázalékot egy táblázatból. Egyszerűen adja meg a mintavételi adatok százalékát. Például véletlenszerűen mintát vehet az adatai tíz százalékából.
Szöveg tokenizálása	Szöveges adat elemzése eltérő szavakra lebontva és az egyes szavak előfordulását megszámolva. Amikor adatfolyamot futtat, az Oracle Analytics létrehoz az adatbázisban egy DR$IndexName$I nevű táblát, amely a token szövegét és a tokenek számához kapcsolódó adatokat tartalmazza. A DR$IndexName$I tábla segítségével adatkészletet hozhat létre. Az indexelni kívánt oszlopok kiválasztásához használja a Kimenetek lapon az egyes mezők mellett található Létrehozás lehetőséget. A Paraméterek részben a Szöveges oszlop alatt kattintson az Oszlop kiválasztása elemre, és válassza ki azt a mezőt, amelyet szeretne különálló szavakra bontani. A Hivatkozási oszlopszám> lehetőségek egy vagy több oszlopot tartalmaznak a kimeneti adatkészletben. Használja a Speciális nyelvi lexikai elemző használata opciót adott nyelvek (például: kínai, dán, holland, angol, finn német, norvég, japán, koreai és svéd) kiválasztásához különleges lexikai elemzőkhöz. A támogatott nyelvekkel kapcsolatos további részletekért lásd: Oracle-adatbázis dokumentációja. Az adatfolyamhoz használt adatbázis-kapcsolathoz speciális adatbázis-jogosultságokra van szükség. Kérje meg a rendszergazdát, hogy ellenőrizze a következőket: Az Ön adatbázisfiókja `EXECUTE on CTXSYS.CTX_DDL jogosultsággal rendelkezik a sémanévhez`. Az Ön által használt Oracle Analytics-kapcsolat felhasználóneve megegyezik annak a sémának a felhasználónevével, amelyik a forrástáblát tartalmazza. Ez a legjobb módja annak, hogy elkerülje a hozzáférési jogosultsággal kapcsolatos problémákat az adatfolyam futtatásakor. Az elemzés alatt álló adatbázistábla-oszlophoz nem tartozik CONTEXT index. Az elemzés alatt álló adatbázistáblához tartozik CONTEXT index, akkor távolítsa el az indexet, mielőtt futtatni kezdené a szövegtokenizáló adatfolyamot.
Idősor	Az Idősor egy adatbányászati technika, amely előrejelzi a célértéket a célértékek ismert előzményei alapján. Az idősor elemzés bemenete a célértékek sora. Becsült célértékeket biztosít egy olyan időablak egyes időszakaira, amely a korábbi adatok előtti legfeljebb 30 időszakot tartalmazhat. A modell különböző statisztikákat is kiszámít, amelyek a korábbi adatoknak való megfelelés minőségét is mérik. Ezek a statisztikák egy korábbi kimeneti adatkészletként érhetők el egy paraméterbeállításon keresztül. Megjegyzés: Az Idősor algoritmus csak az Oracle adatbázis 18c vagy újabb verziói esetében áll rendelkezésre.
Adatok visszaforgatása	Helyezze át az oszlopokban tárolt adatokat sorformátumba. Például áthelyezhet több, minden egyes évhez bevételmérőszám-értéket megjelenítő oszlopot egyetlen Árbevétel oszlopba, amely több értéksort is megjelenít az év dimenzió esetében. Egyszerűen válassza ki az áthelyezendő mérőszám oszlopokat, és adjon nevet az új oszlopnak. Egy új adatkészletet kap, amely kevesebb oszloppal és több sorral rendelkezik.

Megjegyzés: Az elemzési függvények használata előtt ellenőrizze, hogy a rendszergazda engedélyezte-e ezeket (Konzol, Speciális rendszerbeállítások, Teljesítmény és kompatibilitás, Adatbázis-elemzési csomópont engedélyezése adatfolyamokban).