Az adatbázis-elemző függvények lehetővé teszik összetett elemzések és adatbányászati elemzések végrehajtását, például rendellenességek felderítése, adatok fürtözése, adatok mintavételezése és affinitáselemzés. Az elemzőfüggvények akkor érhetők el, ha Oracle Database adatbázishoz vagy Oracle Autonomous Data Warehouse adattárházhoz kapcsolódik.
Az Adatbázis-elemzések lépés megjelenítéséhez az adatfolyam-szerkesztőben kapcsolódnia kell egy Oracle adatbázishoz vagy Oracle Autonomous Data Warehouse adattárházhoz.
Függvénytípusok | Leírás |
---|---|
Rendellenességek dinamikus észlelése |
Előre definiált modell nélkül észlelje a bemeneti adatok rendellenességeit. Például érdemes kiemelni a szokatlan pénzügyi tranzakciókat. Ha ezt a függvényt nagy adatkészletekkel alkalmazza, a maximális teljesítmény elérése érdekében konfigurálja a partícióoszlopokat. |
Dinamikus fürtképzés |
Előre definiált modell nélkül rendezze fürtbe a bemeneti adatait. Például érdemes lehet jellemezni és felfedezni ügyfélszegmenseket marketing célokból. Ha ezt a függvényt nagy adatkészletekkel alkalmazza, a maximális teljesítmény elérése érdekében konfigurálja a partícióoszlopokat. |
Gyakori elemkészlet |
Fedezze fel az adatai között lévő kapcsolatokat olyan elemkészletek azonosításával, amelyek gyakran együtt jelennek meg. Ez az adatbányászási módszer a következő neveken is ismert: társítási szabály tanulása, affinitáselemzés vagy a kiskereskedelmi iparágban mint a piaci kosár elemzése. Ha gyakori elemkészletet használ a piaci kosár elemzési eszközeként, arra a megállapításra juthat, hogy azok a vevők, akik sampont vásárolnak, hajkondicionálót is vesznek. Ez a művelet sok erőforrást igényel, és a végrehajtása számos tényezőtől függ. Ilyenek például a bemeneti adatkészlet mennyisége, a tranzakcióazonosító számossága, és az Elem értéke oszlop számossága. Az adatbázissal kapcsolatban lehetséges teljesítményromlás elkerüléséhez próbálkozzon a minimális támogatási százalék magasabb értékével (az alapértelmezett érték 0,25), és fokozatosan csökkentse, hogy több elemkészletet elhelyezhessen a kimenetében. |
Adatok mintavételezése |
Kiválaszt egy véletlenszerű mintaszázalékot egy táblázatból. Egyszerűen adja meg a mintavételi adatok százalékát. Például véletlenszerűen mintát vehet az adatai tíz százalékából. |
Szöveg lexikális elemzése |
Szöveges adat elemzése eltérő szavakra lebontva és az egyes szavak előfordulását megszámolva. Amikor adatfolyamot futtat, az Oracle Analytics létrehoz az adatbázisban egy DR$IndexName$I nevű táblát, amely a token szövegét és a tokenek számához kapcsolódó adatokat tartalmazza. A DR$IndexName$I tábla segítségével adatkészletet hozhat létre.
Az adatfolyamhoz használt adatbázis-kapcsolathoz speciális adatbázis-jogosultságokra van szükség. Kérje meg a rendszergazdát, hogy ellenőrizze a következőket:
|
Idősor |
Az Idősor egy adatbányászati technika, amely előrejelzi a célértéket a célértékek ismert előzményei alapján. Az idősor elemzés bemenete a célértékek sora. Becsült célértékeket biztosít egy olyan időablak egyes időszakaira, amely a korábbi adatok előtti legfeljebb 30 időszakot tartalmazhat. A modell különböző statisztikákat is kiszámít, amelyek a korábbi adatoknak való megfelelés minőségét is mérik. Ezek a statisztikák egy korábbi kimeneti adatkészletként érhetők el egy paraméterbeállításon keresztül. Megjegyzés: Az Idősor algoritmus csak az Oracle adatbázis 18c vagy újabb verziói esetében áll rendelkezésre. |
Adatok visszaforgatása |
Helyezze át az oszlopokban tárolt adatokat sorformátumba. Például áthelyezhet több, minden egyes évhez bevételmérőszám-értéket megjelenítő oszlopot egyetlen Árbevétel oszlopba, amely több értéksort is megjelenít az év dimenzió esetében. Egyszerűen válassza ki az áthelyezendő mérőszám oszlopokat, és adjon nevet az új oszlopnak. Egy új adatkészletet kap, amely kevesebb oszloppal és több sorral rendelkezik. |
Megjegyzés: Az elemzési függvények használata előtt ellenőrizze, hogy a rendszergazda engedélyezte-e ezeket (Konzol, Speciális rendszerbeállítások, Teljesítmény és kompatibilitás, Adatbázis-elemzési csomópont engedélyezése adatfolyamokban).