Oracle Analytics előrejelző modellek létrehozása és használata

Az Oracle Analytics előrejelző modelljei számos beágyazott Oracle gépi tanulási algoritmust használnak az adatkészletek bányászásához, a célérték előrejelzéséhez vagy a rekordosztályok azonosításához. Az adatfolyam-szerkesztő segítségével előrejelző modelleket hozhat létre, taníthat be, illetve alkalmazhat az adataira.

Az Oracle Analytics előrejelző modelljei

Az Oracle Analytics előrejelző modelljei adott algoritmust alkalmaznak egy adatkészletre értékek, osztályok előrejelzésének megadásához vagy az adatokban csoportok azonosításához.

Az Oracle gépi tanulási modelljeit is használhatja az adatok előrejelzésére.

Az Oracle Analytics olyan algoritmusokat tartalmaz, amelyek segítségével különféle célokból előrejelző modelleket taníthat be. Ilyen algoritmus például a besorolási és a regressziós fa (CART), a logisztikai regresszió és a k-közép.

Az adatfolyam-szerkesztőt használhatja modell első betanításához egy betanítási adatkészleten. Betanítása után az előrejelző modellt az előrejelezni kívánt adatkészletekre alkalmazhatja.

A betanított modelleket elérhetővé teheti más felhasználók számára, akik saját adataikra alkalmazhatják azokat értékek előrejelzéséhez. Bizonyos esetekben adott felhasználók modelleket tanítanak be, míg más felhasználók a modelleket alkalmazzák.

Megjegyzés:

Ha nem biztos benne, hogy mit keressen az adataiban, először az Explain funkciót használhatja, amely a gépi tanulás alkalmazásával azonosítja a tendenciákat és a mintákat. Ezután az adatfolyam-szerkesztőt használhatja előrejelző modellek létrehozásához és betanításához az Explain által talált tendenciák és minták részletezéséhez.
Az adatfolyam-szerkesztő használata modell betanításához:
  • Először létrehoz egy adatfolyamot, és hozzáadja a modell betanításához használni kívánt adatkészletet. Ez a betanítási adatkészlet tartalmazza az előrejelezni kívánt adatokat (például értékként az értékesítés vagy a kor, illetve változóként a hitelkockázati időszak).
  • Szükség szerint az adatfolyam-szerkesztőben oszlopokat vehet fel, jelölhet ki, összekapcsolást hajthat végre stb.
  • Annak megerősítése után, hogy valóban ezekkel az adatokkal kívánja betanítani a modellt, az adatfolyamba felvehet egy betanítási lépést, és besorolási (bináris vagy többszörös), regressziós vagy fürtképzési algoritmust választhat modell betanításához. Ezután nevezze el az eredményül kapott modellt, mentse az adatfolyamot, majd futtassa azt a modell betanításához és létrehozásához.
  • Nézze át a gépi tanulás objektumainak tulajdonságait a modell minőségének megállapításához. Szükség szerint fokozatos közelítést alkalmazhat a betanítási folyamatnál mindaddig, míg a modell el nem éri a kívánt minőséget.

A végleges modellt ismeretlen (azaz címke nélküli) adatok értékeléséhez használhatja adatfolyamon belüli adatkészlet előállításához, illetve előrejelzés megjelenítésének hozzáadásához egy munkafüzethez.

Példa

Tegyük fel, hogy szeretne létrehozni és betanítani egy többszörös osztályozású modellt, és előrejelezni, hogy mely betegeknél nagy a kockázata a szívbetegség kialakulásának.

  1. Hozzon létre egy olyan betanítási adatkészletet, amely az egyes betegek jellegzetességeit tartalmazza, például a korukat, a nemüket, azt, hogy éreztek-e valaha mellkasi fájdalmat, továbbá olyan mutatószámokat, mint a vérnyomás, az éhgyomri vércukorszint, a koleszterinszint és a maximális pulzusszám. A betanítási adatkészlet tartalmaz még egy „Valószínűség” nevű oszlopot is, amelyhez a következő értékek valamelyike van hozzárendelve: hiányzik, kevésbé valószínű, valószínű, nagyon valószínű vagy jelen van.
  2. Válassza a CART (döntési fa) algoritmust, mert az kihagyja a felesleges oszlopokat, amelyek nem adnak hozzá értéket az előrejelzéshez, valamint csak azokat az oszlopokat azonosítja és használja, amelyek segítenek a cél előrejelzésében. Amikor hozzáadja az algoritmust az adatfolyamhoz, a Valószínűség oszlopot válassza a modell betanításához. Az algoritmus a gépi tanulás segítségével választja ki azokat a tényoszlopokat, amelyekre szüksége van az előrejelzések és a kapcsolódó adatkészletek végrehajtásához és előállításához.
  3. Ellenőrizze az eredményeket, és végezze el a betanítási modell finomhangolását, majd alkalmazza a modellt egy nagyobb adatkészletre annak előre előrejelzéséhez, hogy mely betegeknél nagy a valószínűsége a szívbetegség meglétének vagy kialakulásának.

Hogyan választhatom ki az előrejelző modell algoritmusát?

Az Oracle Analytics mindenhez biztosít algoritmusokat, amire a gépi tanulási modellezésnek szüksége van: numerikus előrejelzéshez, többszörös osztályozóhoz, bináris osztályozóhoz és fürtképzéshez.

Az Oracle gépi tanulási funkciója olyan szakképzett adatelemzők számára készült, akik tudják, hogy mit kell keresniük az adataikban, ismerik az előrejelző analitika gyakorlatát, és megértik az algoritmusok közötti eltéréseket.

Megjegyzés:

Ha az Oracle Autonomous Data Warehouse adattárházból származó adatokat használ, az AutoML funkció használatával gyorsan és egyszerűen kiképezhet egy prediktív modellt. Ehhez gépi tanulással kapcsolatos szakértelemre sincsen szüksége. Lásd: Prediktív modell betanítása az AutoML használatával az Autonomous Data Warehouse adattárházban.

A felhasználók általában többszörös előrejelzési modelleket szeretnének létrehozni, összehasonlítani azokat, és kiválasztani azt az egyet, amelyik a legnagyobb valószínűséggel ad olyan eredményeket, amelyek kielégítik feltételeiket és követelményeiket. Ezek a feltételek változóak lehetnek. Például néha a felhasználók olyan modelleket választanak, amelyeknek jobb az általános pontossága, néha pedig olyanokat, amelyek a legkevesebb I. típusú (hamis pozitív) és II. típusú (hamis negatív) hibát tartalmazzák. Néha a felhasználók olyan modelleket választanak, amelyek gyorsabban és elfogadhatóbb pontossági szinten adják vissza az eredményeket még akkor is, ha az eredmények nem ideálisak.

Az Oracle Analytics számos gépi tanulási algoritmust tartalmaz az előrejelzés vagy osztályozás minden egyes típusához. Ezekkel az algoritmusokkal a felhasználók több modellt is létrehozhatnak, vagy különböző finomhangolású paramétereket használhatnak, vagy különböző bemeneti betanítási adatkészleteket használhatnak, majd kiválaszthatják a legjobb modellt. A felhasználók a modelleket a saját feltételeik alapján összehasonlítva vagy súlyozva kiválaszthatják a legjobb modellt. A legjobb modell meghatározásához a felhasználók alkalmazhatják a modellt, és megjeleníthetik a számítások eredményeit a pontosság meghatározása érdekében, vagy megnyithatják és böngészhetik azokat a kapcsolódó adatkészleteket, amelyeket az Oracle Analytics használt a modell kimeneti adatainak előállításához.

A megadott algoritmusokkal kapcsolatos információkért tekintse meg az alábbi táblázatot:

Név Típus Kategória Függvény Leírás
CART

Besorolás

Regresszió

Bináris osztályozó

Többszörös osztályozó

Numerikus

- Döntési fákat használ a diszkrét és a folyamatos értékek előrejelzéséhez egyaránt.

Nagy adatkészletekhez használja.

Rugalmas hálózat lineáris regressziója Regresszió Numerikus ElasticNet Speciális regressziós modell. További adatokat biztosít (szabályozás), végrehajtja a változók kiválasztását és a lineáris kombinációkat. A Lasso és a Ridge regressziós módszerre vonatkozó hibapontok.

A kollinearitás (több attribútum tökéletes korrelációja) és a túlillesztés elkerülése érdekében nagy számú attribútumhoz használja.

Hierarchikus Fürtképzés Fürtképzés AgglomerativeClustering Fürtképzési hierarchiát alakít ki vagy lentről felfelé (minden egyes megfigyelés a saját fürtje, aztán egyesítve van), vagy fentről lefelé irányuló módszerrel (az összes megfigyelés egyetlen fürtként indul) és távolsági mérőszámok alkalmazásával.

Akkor használja, ha az adatkészlet nem nagy, és nem tudja előre a fürtök számát.

K-közép Fürtképzés Fürtképzés k-közép A megfigyeléseket iteratív módon k fürtbe osztja szét úgy, hogy mindegyik megfigyelés a hozzá legközelebbi középértékkel rendelkező fürthöz tartozik.

A mérőszámoszlopok fürtözéséhez használja, a szükséges fürtök várt számának beállításával. Nagy méretű adatkészletek esetén jól működik. Az eredmény minden egyes futás során más.

Lineáris regresszió Regresszió Numerikus Ordinary Least Squares

Ridge

Lasso

Lineáris megközelítés a célváltozó és az adatkészletben lévő más attribútumok közötti kapcsolat modellezéséhez.

Akkor használja a numerikus értékek előrejelzéséhez, ha az attribútumok nem teljesen korreláltak.

Logisztikai regresszió Regresszió Bináris osztályozó LogisticRegressionCV Kategorikusan függő változó értékének az előrejelzéséhez használja. A függő változó olyan bináris változó, amelyik 1-re vagy 0-ra kódolt adatot tartalmaz.
Naive Bayes Besorolás

Bináris osztályozó

Többszörös osztályozó

GaussianNB A Bayes tételen alapuló probabilisztikus osztályozás, amely feltételezi, hogy a funkciók között nincs függőség.

Nagy számú bemeneti dimenzió esetén használja.

Neurális hálózat Besorolás

Bináris osztályozó

Többszörös osztályozó

MLPClassifier Olyan iteratív osztályozási algoritmus, amely abból tanul, hogy összehasonlítja az osztályozási eredményét a tényleges értékkel, és visszaadja azt a hálózatnak, hogy módosítsa az algoritmust a további iterációkhoz.

Szövegelemzéshez használja.

Random Forest Besorolás

Bináris osztályozó

Többszörös osztályozó

Numerikus

- Olyan együttes tanulási módszer, amely több döntési fát hoz létre, és olyan kimeneti értéket ad, amely együttesen képviseli az összes döntési fát.

Numerikus és kategorikus változók előrejelzéséhez használja.

SVM Besorolás

Bináris osztályozó

Többszörös osztályozó

LinearSVC, SVC Úgy osztályozza a rekordokat, hogy leképezi őket a térben, és olyan hipersíkokat hoz létre, amelyek használhatók az osztályozáshoz. Az új rekordok (értékelési adatok) leképeződnek a térben, és az előrejelzés szerint egy olyan kategóriához tartoznak, amely a hipersíknak azon az oldalán alapul, amelyikre esnek.

Előrejelző modell betanítása AutoML segítségével az Oracle Autonomous Data Warehouse szolgáltatásban

Ha az Oracle Autonomous Data Warehouse adattárházból származó adatokat használ, igénybe veheti az AutoML funkciót prediktív modell javasolásához és képzéséhez. Az AutoML elemzi az Ön adatait, kiszámítja a legjobban használható algoritmust, és regisztrál egy előrejelzési modellt az Oracle Analytics szolgáltatásban, hogy előrejelzéseket készíthessen az adataival kapcsolatban.

Az AutoML funkció használatakor az Oracle Autonomous Data Warehouse adattárház elvégzi Ön helyett a kemény munkát, hogy gépi tanulási vagy mesterséges intelligenciával kapcsolatos szakértelem nélkül is üzembe tudjon helyezni egy előrejelzési modellt. A létrehozott előrejelzési modellt a szolgáltatás a Gépi tanulás oldal Modellek területére menti. Ha az új modell alapján szeretne adatokat előrejelezni, hozzon létre egy adatfolyamot, és használja a Modell alkalmazása lépést.
A kezdés előtt:
  • Hozzon létre egy adatkészletet, amely azokon az Oracle Autonomous Data Warehouse adattárházban található adatokon alapul, amelyekről előrejelzéseket kíván készíteni. Például, előfordulhat, hogy vannak adatai az alkalmazottak lemorzsolódásáról, amelyek tartalmaznak egy ATTRITION nevű mezőt, amelynél a lemorzsolódás „Igen” vagy „Nem” értékkel van jelölve.
  • Győződjön meg arról, hogy az a felhasználó, akit meghatározott az Oracle Analytics és az Oracle Autonomous Data Warehouse adattárház közötti kapcsolatban, az OML_Developer szerepkörrel rendelkezik, és nem „rendszergazda” teljes jogú felhasználó. Egyéb esetben az adatfolyam sikertelen lesz, amikor megpróbálja menteni vagy futtatni.
  1. A Kezdőlapon kattintson a Létrehozás gombra, majd az Adatfolyam elemre.
  2. Az Adatkészlet hozzáadása elemnél válassza ki az elemezni kívánt adatokat tartalmazó, az Oracle Autonomous Data Warehouse adattárházon alapuló adatkészletet.
  3. Kattintson a Lépés hozzáadása, majd az AutoML elemre.
  4. A Cél elemnél kattintson a Válasszon oszlopot, lehetőségre, és válassza ki azt az adatoszlopot, amely az előrejelezni kívánt értéket tartalmazza.
    Például a lemorzsolódás előrejelzéséhez válasszon egy ATTRITION nevű mezőt, amelynél „TRUE” és „FALSE” (igaz és hamis) értékek jelzik, hogy az alkalmazott elhagyta-e a vállalatot.

  5. Fogadja el az Oracle Analytics által javasolt Feladattípus és Modellrangsorolási mérőszám elemet, vagy válasszon egy másik algoritmust.
  6. Kattintson a Modell mentése elemre, és határozza meg a generált előrejelzési modell nevét.
  7. Kattintson a Mentés elemre, és határozza meg az adatfolyam nevét.
  8. Kattintson a Futtatás elemre az adatok elemzéséhez és a prediktív modell generálásához.
  9. A kezdőoldalon kattintson a Navigálás, majd a Gépi tanulás lehetőségre, majd kattintson a jobb gombbal a generált modellre, és válassza az Ellenőrzés lehetőséget.
Az Oracle Analytics által generált modellt a Modellek lap Gépi tanulás oldalán találhatja meg. Vizsgálja meg a modellt, és értékelje a minőségét. Lásd: Előrejelző modell minőségének értékelése. Az AutoML által generált modellekhez létrehozott kapcsolódó adatkészletekre is hivatkozhat. Lásd: Mik egy előrejelző modell kapcsolódó adatkészletei?.

Előrejelző modell létrehozása és betanítása

A képzett adatelemzők prediktív modelleket hoznak létre és tanítanak be, hogy használhassák őket Oracle Machine Learning-algoritmusok telepítéséhez, amelyek segítségével adatkészleteket bányászhatnak, előrejelezhetnek célértékeket, vagy rekordosztályokat azonosíthatnak. Az adatfolyam-szerkesztő segítségével prediktív modelleket hozhat létre, taníthat be és alkalmazhat az adataira.

Útmutató ikon LiveLabs Sprint

Pontos modell elérése iteratív folyamat, és a gyakorlott adatelemző különböző modelleket próbálhat ki, összehasonlíthatja ezek eredményeit, és közelítéses módszerrel finomíthatja a paramétereket. Az adatelemző a végleges, pontos előrejelző modellt más adatkészletekben lévő tendenciák felderítésére használhatja, vagy a modellt felveheti munkafüzetekbe.

Megjegyzés:

Ha az Oracle Autonomous Data Warehouse adattárházból származó adatokat használ, az AutoML funkció használatával gyorsan és egyszerűen kiképezhet egy prediktív modellt. Ehhez gépi tanulással kapcsolatos szakértelemre sincsen szüksége. Lásd: Előrejelző modell betanítása AutoML segítségével az Autonomous Data Warehouse szolgáltatásban

Az Oracle Analytics algoritmusokat biztosít a numerikus előrejelzés, a többszörös besorolás, a bináris besorolás és a fürtképzés számára.

  1. A Kezdőlapon kattintson a Létrehozás gombra, majd válassza ki az Adatfolyam elemet.
  2. Jelölje ki a modell betanításához használni kívánt adatkészletet. Kattintson a Hozzáadás elemre.
  3. Az adatfolyam-szerkesztőben kattintson a Lépés hozzáadása (+) elemre.
    Adatkészlet hozzáadása után használhatja ennek összes oszlopát a modell kialakításához, vagy kijelölheti csak a fontos oszlopokat. A fontos oszlopok kijelöléséhez az adatkészlet alapos ismerete szükséges. Hagyja figyelmen kívül azokat az oszlopokat, amelyek bizonyosan nem lesznek hatással a kimeneti viselkedésre, vagy amelyek redundáns adatokat tartalmaznak. Csak a fontos oszlopok kijelöléséhez vegye fel az Oszlopok kijelölése lépést. Ha nem biztos benne, hogy melyek a fontos oszlopok, inkább használja mindegyiket.
  4. Válassza az egyik modellbetanítási lépést (például Numerikus előrejelzés betanítása vagy Csoportosítás betanítása).
  5. Jelöljön ki egy algoritmust, és kattintson a OK gombra.
  6. Ha felügyelt modellel dolgozik, ilyen az előrejelzés vagy a besorolás, kattintson a Cél elemre, és jelölje ki az előrejelezni kívánt oszlopot. Ha például adott személy jövedelmére előrejelzést adó modellt hoz létre, jelölje ki a Jövedelem oszlopot.
    Ha felügyelet nélküli modellel dolgozik, ilyen a fürtképzés, akkor nincs szükség céloszlopra.
  7. Modelljénél az alapértelmezett beállítások módosításával finomíthatja és javíthatja az előrejelzés eredményének pontosságát. Ezeket a beállításokat az adott modell határozza meg.
  8. Kattintson a Modell mentése lépésre és adja meg a nevét és a leírását.
  9. Kattintson a Mentés elemre, adja meg az adatfolyam nevét és leírását, majd az adatfolyam mentéséhez kattintson az OK gombra.
  10. Kattintson az Adatfolyam futtatása elemre az előrejelző modell létrehozásához a bemeneti adatkészlet és a megadott modellbeállítások alapján.

Az adatfolyam lépései a gépi tanulási modellek betanításához

Az Oracle Analytics segítségével gépi tanulási modelleket taníthat az adatfolyamok lépéseinek használatára. Amint elkészült egy gépi tanulási modell képzésével, alkalmazhatja azt az adataira a Modell alkalmazása lépés használatával.

Lépés neve Leírás
AutoML (Oracle Autonomous Data Warehouse szükséges) Használja az Oracle Autonomous Data Warehouse AutoML funkcióját prediktív modell javasolásához és képzéséhez. Az AutoML lépés elemzi az adatokat, kiszámítja a legjobban használható algoritmust, és rögzít egy előrejelzési modellt az Oracle Analytics programban.
Bináris besorolás betanítása

Betaníthat egy gépi tanulási modellt arra, hogy az adatokat osztályozással besorolja a két előre definiált kategória egyikébe.

Csoportosítás betanítása Betaníthat egy gépi tanulási modellt arra, hogy különítse el a hasonló jellemzőkkel rendelkező csoportokat, és szervezze azokat fürtökbe.
Többféle besorolás betanítása Betaníthat egy gépi tanulási modellt arra, hogy az adatokat osztályozással besorolja három vagy több előre definiált kategóriába.
Numerikus előrejelzés betanítása Betaníthat egy gépi tanulási modellt arra, hogy az ismert adatértékek alapján előre jelezzen egy numerikus értéket.

Előrejelző modell ellenőrzése

Az előrejelző modell létrehozása és az adatfolyam futtatása után pontosságának meghatározásához áttekintheti a modellre vonatkozó adatokat. Az adatok alapján iteratív módon módosíthatja a modell beállításait a pontosság javítása és a megfelelőbb eredmények előrejelzése érdekében.

Előrejelző modell adatainak megtekintése

Az előrejelző modell részletes adatai segítenek megérteni a modell használatát, és megállapítani, hogy az alkalmas-e az adatai előrejelzésére. A modell részletes adatai a következőket tartalmazzák: modellosztály, algoritmus, bemeneti oszlopok és kimeneti oszlopok.

  1. A kezdőlapon kattintson a Navigátor, majd a Gépi tanulás elemre.
  2. Kattintson a betanítási modellhez tartozó Menü ikonra, és válassza ki az Ellenőrzés műveletet.
  3. A modell adatainak megtekintéséhez kattintson a Részletek elemre.

Előrejelző modell minőségének értékelése

Tekintse meg ezeket az információkat, melyek segítségével jobban megértheti az előrejelző modell minőségét. Megvizsgálhatja például a pontosság mutatószámait, mint például a modell pontossága, precizitás, érzékenység, F1 érték, hamis pozitív eredmények aránya.

Az Oracle Analytics a modell létrehozásához használt algoritmustól függetlenül hasonló mutatószámokat biztosít, így egyszerűen összehasonlíthatók a különböző modellek. A modell létrehozási folyamata során a Betanítási partíció százalékos értéke paraméter alapján a bemeneti adatkészletet két részre osztja a rendszer a modell betanításához és teszteléséhez. A modell az adatkészlet tesztelési részét használja a kialakítás alatti modell pontosságának ellenőrzéséhez.
Az eredmények alapján lehet, hogy a Minőség lapon módosítania kell a modell paramétereit, és újra be kell tanítania.
  1. A kezdőlapon kattintson a Navigátor, majd a Gépi tanulás elemre.
  2. Kattintson a betanítási modellhez tartozó Menü ikonra, és válassza ki az Ellenőrzés műveletet.
  3. A modell minőségi mutatószámainak áttekintéséhez és a modell kiértékeléséhez kattintson a Minőség lapfülre. Tekintse át például a Modellpontosság pontszámát.

Tipp: Kattintson a Továbbiak lehetőségre a modellhez generált nézetek részleteinek megtekintéséhez.

Mik egy előrejelző modell kapcsolódó adatkészletei?

Amikor adatfolyamot futtat az Oracle Analytics előrejelző modelljéhez tartozó betanítási modell létrehozásához, az Oracle Analytics kapcsolódó adatkészleteket hoz létre. Ezen adatkészleteken munkafüzeteket nyithat meg vagy hozhat létre a modell pontosságának megismeréséhez.

A modellhez választott algoritmustól függően a kapcsolódó adatkészletek a modellre vonatkozó részleteket tartalmaznak: előrejelzési szabályok, pontosság mutatószámai, bizonytalansági mátrix, előrejelzés kulcstényezői. Ezeket az adatokat a modell finomításához használhatja megfelelőbb eredmények elérése érdekében, valamint a kapcsolódó adatkészletek segítségével összehasonlíthatja a modelleket, és eldöntheti, hogy melyik a pontosabb.

Például megnyithat egy Tényezők adatkészletet annak felderítéséhez, hogy mely oszlopok vannak erős pozitív vagy negatív hatással a modellre. Ezeknek az oszlopoknak a vizsgálatával arra juthat, hogy egyes oszlopok nem tekinthetők modellváltozónak, mert nem valószerű bemenetek, vagy mert túl részletesek az előrejelzéshez. Az adatfolyam-szerkesztőben megnyithatja a modellt, és a felderített adatok alapján eltávolíthatja a nem odaillő vagy túl részletes oszlopokat, és újból előállíthatja a modellt. A Minőség és az Eredmények lapon ellenőrizheti, hogy javult-e a modell pontossága. Addig folytathatja ezt az eljárást, míg elégedett nem lesz a modell pontosságával, és így az készen áll egy új adatkészlet értékelésére.

A különböző algoritmusok hasonló kapcsolódó adatkészleteket állítanak elő. Az algoritmus típusától függően az egyes paraméterek és oszlopnevek változhatnak az adatkészletben, de az adatkészlet funkciója változatlan marad. Például egy statisztikai adatkészletben az oszlopnév Lineáris regresszió helyett Logisztikai regresszió lehet, de a statisztikai adatkészlet a modell pontosságának mutatószámait tartalmazza.

Kapcsolódó adatkészletek AutoML modellekhez

Amikor egy prediktív modellt tanít be az AutoML használatával, az Oracle Analytics további adatkészleteket hoz létre, amelyek hasznos információkat tartalmaznak a modellről. A létrehozott adatkészletek száma a modell algoritmusától függ. Például a Naive Bayes-modellek esetében az Oracle Analytics létrehoz egy adatkészletet, amely információkat nyújt a feltételes valószínűségekről. Döntési fa modell esetén az adatkészlet a döntési fa statisztikáiról nyújt információkat. Amikor egy AutoML által generált modellt megvizsgál az általános lineáris modell (GLM) algoritmus használatával, bejegyzések jelennek meg (GLM* előtaggal) azon modellspecifikus adatkészletek esetében, amelyek metaadat-információkat tartalmaznak a modellről.
A(z) GUID-1A190D76-82D5-4BEC-82C4-D881CFECA14D-default.png leírása
.png ábra leírása

Kapcsolódó adatkészletek

Megjegyzés:

Az Oracla Analytics hozzáfűzi az adatfolyam kimeneti nevét a kapcsolódó adatkészlet típusához. Például egy CART-modell esetében, ha az adatfolyam kimenetének neve cart_model2, akkor az adatkészlet neve cart_model2_CART.

CART

Az Oracle Analytics létrehoz egy táblát a CART-hoz (besorolási és a regressziós fa) kapcsolódó adatkészlethez, és az ebben szereplő oszlopok tartalmazzák a döntési fa feltételeit és a feltételek kritériumait, előrejelzést minden csoporthoz, valamint az előrejelzés megbízhatóságát. A fadiagram ábrázolás segítségével ábrázolható a döntési fa.

A CART adatkészletet akkor hozza létre a rendszer, ha a modellek és algoritmusok ezen kombinációit választja.

Modell Algoritmus
Numerikus CART numerikus előrejelzéshez
Bináris besorolás CART
Többszörös besorolás CART

Besorolási kimutatás

Az Oracle Analytics létrehoz egy táblát a Besorolási kimutatás kapcsolódó adatkészletéhez. Ha például a céloszlop két eltérő értékkel (Igen vagy Nem) rendelkezhet, az adatkészlet a céloszlop minden eltérő értékénél a pontosság mutatószámait jeleníti meg, ilyenek a következők: F1, pontosság, érzékenység és támogatás (a betanítási adatkészletben ezzel az értékkel rendelkező sorok száma).

A Besorolási kimutatás adatkészletet akkor hozza létre a rendszer, ha a modellek és algoritmusok ezen kombinációit választja.

Modell Algoritmusok
Bináris besorolás

Naive Bayes

Neurális hálózat

Support Vector Machine

Többszörös besorolás

Naive Bayes

Neurális hálózat

Support Vector Machine

Bizonytalansági mátrix

Az Oracle Analytics létrehoz egy kimutatástáblát a Bizonytalansági mátrixhoz kapcsolódó adatkészlethez (más néven ez a hibamátrix). Minden sor egy előrejelzett osztály példányát képviseli, míg minden oszlop egy tényleges osztályban lévő példányt jelent. Ez a táblázat a hamis pozitívok, hamis negatívok, igaz pozitívok és igaz negatívok számát mutatja ki, amelyeket a precizitás, érzékenység és F1 pontossági mutatószám kiszámításánál használ a rendszer.

A Bizonytalansági mátrix adatkészletet akkor hozza létre a rendszer, ha a modellek és algoritmusok következő kombinációit választja.

Modell Algoritmusok
Bináris besorolás

Logisztikai regresszió

CART (döntési fa)

Naive Bayes

Neurális hálózat

Random Forest

Support Vector Machine

Többszörös besorolás

CART (döntési fa)

Naive Bayes

Neurális hálózat

Random Forest

Support Vector Machine

Tényezők

Az Oracle Analytics létrehoz egy táblát a Determinánsokhoz kapcsolódó adatkészlethez, amely a céloszlop értékeit meghatározó oszlopokról tartalmaz adatokat. Az oszlopok azonosításához lineáris regressziót használ a rendszer. Minden oszlophoz együttható és korrelációs érték van hozzárendelve. Az együttható értéke az oszlop súlyozott korát írja le, amelyet a céloszlop értékének meghatározásához használ a rendszer. A korrelációs érték a céloszlop és a függő oszlop közötti kapcsolat irányát jelzi. Például hogy a céloszlop értéke növekszik vagy csökken a függő oszlop alapján.

A Tényezők adatkészletet akkor hozza létre a rendszer, ha a modellek és algoritmusok ezen kombinációit választja.

Modell Algoritmusok
Numerikus

Lineáris regresszió

Rugalmas hálózat lineáris regressziója

Bináris besorolás

Logisztikai regresszió

Support Vector Machine

Többszörös besorolás Support Vector Machine

Találati térkép

Az Oracle Analytics létrehoz egy táblát a Találati térképhez kapcsolódó adatkészlethez, amely a döntési fa levélcsomópontjairól tartalmaz adatokat. A táblázat minden sora egy levélcsomópontot jelent, és a levélcsomópont által képviselt értéket leíró adatot tartalmaz, például a szegmens mérete, megbízhatóság és a sorok várható száma. Például: helyes előrejelzések száma = szegmensméret * megbízhatóság.

A Találati térkép adatkészletét akkor hozza létre a rendszer, ha a modellek és algoritmusok ezen kombinációit választja.

Modell Algoritmus
Numerikus CART numerikus előrejelzéshez

Maradványok

Az Oracle Analytics létrehoz egy táblát a Maradványokhoz kapcsolódó adatkészlethez, amely a maradvány-előrejelzésekről tartalmaz adatokat. A maradvány a mért érték és a regressziós modell előrejelzett értéke közötti eltérés. Az adatkészlet a tényleges és az előrejelzett értékek közötti abszolút eltérések összesített összegét tartalmazza az adatkészlet összes oszlopára.

A Maradványok adatkészletét akkor hozza létre a rendszer, ha a modellek és algoritmusok ezen kombinációit választja.

Modell Algoritmusok
Számértékek

Lineáris regresszió

Rugalmas hálózat lineáris regressziója

CART numerikus előrejelzéshez

Bináris besorolás CART (döntési fa)
Többszörös besorolás CART (döntési fa)

Statisztika

Az Oracle Analytics létrehoz egy táblát a Statisztikákhoz kapcsolódó adatkészlethez. Az adatkészlet mutatószámai az előállításukhoz használt algoritmustól függenek. Ez a mutatószámlista a következő algoritmuson alapul:

  • Lineáris regresszió, CART numerikus előrejelzéshez, Rugalmas hálózat lineáris regressziója – Ezek az algoritmusok a következőket tartalmazzák: R-négyzet, Módosított R-négyzet, Középérték abszolút hibája (MAE), Középérték négyzetes hibája (MSE), Relatív abszolút hiba (RAE), Kapcsolódó négyzetes hiba (RSE), Gyökér középérték négyzetes hibája (RMSE).
  • CART (osztályozási és regressziós fák), Naive Bayes osztályozás, Neurális hálózat, Support Vector Machine (SVM), Random Forest, Logisztikai regresszió – Ezek az algoritmusok a következőket tartalmazzák: Pontosság, F1 összesen.

Ezt az adatkészletet akkor hozza létre a rendszer, ha a modellek és algoritmusok ezen kombinációit választja.

Modell Algoritmus
Numerikus

Lineáris regresszió

Rugalmas hálózat lineáris regressziója

CART numerikus előrejelzéshez

Bináris besorolás

Logisztikai regresszió

CART (döntési fa)

Naive Bayes

Neurális hálózat

Random Forest

Support Vector Machine

Többszörös besorolás

Naive Bayes

Neurális hálózat

Random Forest

Support Vector Machine

Összegzés

Az Oracle Analytics létrehoz egy táblát az Összegzéshez kapcsolódó adatkészlethez, amely olyan információkat tartalmaz, mint a Cél neve és a Modell neve.

Az Összegzés adatkészletet akkor hozza létre a rendszer, ha a modellek és algoritmusok ezen kombinációit választja.

Modell Algoritmusok
Bináris besorolás

Naive Bayes

Neurális hálózat

Support Vector Machine

Többszörös besorolás

Naive Bayes

Neurális hálózat

Support Vector Machine

Előrejelző modell kapcsolódó adatkészleteinek megkeresése

Előrejelző modell betanításakor a rendszer kapcsolódó adatkészleteket állít elő.

Az algoritmustól függően a kapcsolódó adatkészletek a modellre vonatkozó részleteket tartalmaznak: előrejelzési szabályok, pontosság mutatószámai, bizonytalansági mátrix, előrejelzés kulcstényezői stb. A paraméterek elősegítik azoknak a szabályoknak a megértését, amelyeket a modellek használtak az előrejelzések és a besorolások meghatározásához.
  1. A kezdőlapon kattintson a Navigátor, majd a Gépi tanulás elemre.
  2. Kattintson a betanítási modellhez tartozó Menü ikonra, és válassza ki az Ellenőrzés műveletet.
  3. A modell kapcsolódó adatkészleteinek eléréséhez kattintson a Kapcsolódó lapfülre.
  4. A megtekintéséhez vagy munkafüzetben való használatához duplán kattintson egy kapcsolódó adatkészletre.

Előrejelző modell hozzáadása egy munkafüzethez

Amikor forgatókönyvet hoz létre egy munkafüzetben, előrejelző modellt alkalmaz a munkafüzet adatkészletére azon tendenciák és minták feltárásához, amelyek keresésére a modellt kialakították.

Megjegyzés:

Nem alkalmazhat egy Oracle gépi tanulási modellt egy munkafüzet adataira.
Miután felvette a modellt a munkafüzetbe, és a modell bemeneteit leképezte az adatkészlet oszlopaira, az Adatok panel a modell azon objektumait tartalmazza, amelyeket áthúzhat a vászonra. A gépi tanulás a megjelenítés megfelelő adatoszlopai alapján előállítja a modell értékeit.
  1. A Kezdőlapon kattintson a Létrehozás gombra, majd kattintson a Munkafüzet elemre.
  2. Jelölje ki a munkafüzet létrehozásához használni kívánt adatkészletet, majd kattintson a Hozzáadás a munkafüzethez lépésre.
  3. Az Adatok ablaktáblában kattintson a Hozzáadás elemre, és válassza a Forgatókönyv létrehozása műveletet.
  4. A Forgatókönyv létrehozása - Modell kiválasztása párbeszédpanelen jelöljön ki egy modellt, majd kattintson az OK gombra.
    Csak egy előrejelző modellt alkalmazhat. Nem alkalmazhat egy Oracle gépi tanulási modellt.
    Ha nem minden modellbemenet feleltethető meg adatelemnek, akkor az Adatok leképezése a modellre párbeszédpanel jelenik meg.
  5. Ha az Adatok leképezése a modellre párbeszédpanel jelenik meg, az Adatkészlet mezőben jelölje ki a modellel használni kívánt adatkészletet.
  6. Szükség szerint adja meg a modellbemenetek és az adatelemek megfeleltetését. Kattintson a Kész gombra.
    A forgatókönyv adatkészletként jelenik meg az Adatelemek ablaktáblában.
  7. Húzzon át elemeket az adatkészletből és a modellből a Megjelenítés vászonra.
  8. A forgatókönyv módosításához kattintson rá a jobb gombbal az Adatelemek ablaktáblában, és válassza a Forgatókönyv szerkesztése műveletet.
  9. Módosítsa az adatkészletet és szükség szerint a modellbemenet és az adatelemek megfeleltetését.
  10. Kattintson a Mentés lépésre a munkafüzet mentéséhez.