Adatok elemzése az Explain használatával

Az Explain a gépi tanulás segítségével keresi meg az adataira vonatkozó hasznos helyzetképeket.

Mi az az Explain?

Az Explain az adatkészletével összefüggésben elemzi a kijelölt oszlopot, és szöveges leírásokat állít elő a felismert helyzetképekről. Például bármely tetszőleges oszlopnál megismerheti az alapvető tényeket, a kulcstényezőket, a magyarázó szegmenseket és a rendellenességeket.

Az Explain az Oracle gépi tanulás funkcióját használja pontos, gyors és hatékony információk előállításához az adatokról, és megfelelő megjelenítéseket állít elő, amelyeket felvehet a munkafüzet vásznára.

Az Explain azon adatelemzők számára készült, akik valószínűleg nem ismerik, hogy milyen adattrendeket keresnek, és nem kívánnak időt fordítani a kísérletezésre oszlopok áthúzásával a vászonra, vagy adatfolyamok használatával előrejelző modellek betanítására és alkalmazására.

Az Explain emellett hasznos kiindulási pont lehet az adatelemzők számára az adatokban keresett tendencia megerősítéséhez, majd ennek alapján olyan előrejelző modellek létrehozásához és finomításához, amelyeket más adatkészletekre alkalmazhatnak.

Mik azok a helyzetképek?

A helyzetképek olyan kategóriák, amelyek a kiválasztott oszlopot ismertetik az adatkészlete környezetében.

Útmutató ikon LiveLabs Sprint

Az Explain által nyújtott helyzetképek az Ön által kiválasztott oszloptípuson vagy összesítésen alapulnak, és a kiválasztott mérőszámra vonatkozó összesítési szabálynak megfelelően fognak változni. Az Explain szolgáltatás csak az Ön által kiválasztott oszloptípusnak megfelelő helyzetképeket állít elő.

Helyzetkép típusa Leírás
Alapvető tényadatok Az oszlop értékeinek alapvető elosztását jeleníti meg. Az oszlop adatai az adatkészlet egyes mérőszámai szerint vannak lebontva.
Ez a helyzetkép minden oszloptípus esetén elérhető.
  • Egy kiválasztott mérőszám esetében ez a helyzetkép az összesített mérőszámérték elosztását mutatja az egyes attribútumoszlopok minden egyes tagjánál.
  • Egy kiválasztott attribútum esetében ez a helyzetkép az adatkészlet egyes mérőszámainak értékét mutatja az attribútum minden egyes tagi értékénél.
Kulcstényezők Az adatkészletben lévő azon oszlopokat jeleníti meg, amelyek a legmagasabb korrelációs százalékot tartalmazzák a kiválasztott oszloperedménnyel. A diagramok a kiválasztott érték eloszlását jelenítik meg az egyes korrelációs attribútumértékek között.

Ez a lap csak az attribútumoszlopok magyarázásakor vagy pedig olyan mérőszámoszlop magyarázásakor jelenik meg, amelyik átlagos összesítési szabállyal rendelkezik.

Szegmensek Az oszlop értékei közül a kulcsfontosságú szegmenseket (vagy csoportokat) jeleníti meg. Az Explain egy osztályozási algoritmust futtat le az adatokon, hogy meghatározza az adatértékek metszéspontjait és azonosítsa az értéktartományokat az összes olyan dimenzióban, amely a legnagyobb valószínűséget hozza létre az attribútum adott eredményéhez.

Például egy bizonyos helycsoportból származó, egy bizonyos képzésiév-tartománnyal rendelkező, egy bizonyos életkortartományba tartozó egyének csoportja olyan szegmenset alkot, amelynél óriási a valószínűsége annak, hogy megvásárol egy adott terméket.

Ez a lap csak az attribútumoszlopok magyarázásakor jelenik meg.

Rendellenességek Olyan értéksorozatot azonosít, amelyben az (összesített) értékek egyike jelentős mértékben eltér a regressziós algoritmusok által elvárt értéktől.

Az Explain használata az adatok helyzetképének felderítéséhez

Ha kijelöl egy oszlopot, és az Explain funkciót választja, az Oracle Analytics a gépi tanulás használatával az adatkészlettel összefüggésben elemzi az oszlopot. Például az Explain tendenciákat és rendellenességeket keres a kijelölt adatokban.

Az Explain szöveges leírások és megjelenítések formájában közli a megállapításait, amelyeket felvehet a munkafüzet vásznára.
Ha az Explain szolgáltatást oszlopon hajtja végre, és az eredmények túl sok kapcsolódó és magas besorolású oszlopot tartalmaznak (például irányítószám várossal vagy állammal), akkor egyes oszlopok kizárhatók az adatkészletből, hogy az Explain értelmesebb tendenciákat tudjon azonosítani. Lásd: Oszlop elrejtése vagy törlése.

Az Explain azt követően áll rendelkezésre, hogy Ön telepítette a gépi tanulást az Ön helyi Oracle Analytics Desktop könyvtárába. Lásd: Hogyan telepíthető a Machine Learning a Desktop részére?

  1. Új munkafüzet létrehozásához a Kezdőlapon kattintson a Létrehozás, majd a Munkafüzet lépésre.
  2. Kattintson a Megjelenítés elemre a Megjelenítés oldal megnyitásához.
  3. Az Adatok panelen kattintson a jobb gombbal egy oszlopra, és válassza az Explain - <adatelem> műveletet.

    Az Explain számára az attribútumok sikeres elemzéséhez az attribútumnak 3–99 eltérő értékkel kell rendelkeznie.
    Az Explain párbeszédpanel alapvető tényadatokat, rendellenességeket és más adatokat jelenít meg a kijelölt oszlopról.
  4. A lapokra kattintva tekintse át a többi kategória javasolt helyzetképeit. Például: Alapvető tényadatok - <attribute> vagy A(z) <attribute> rendellenességei.
  5. A munkafüzet vásznára felvenni kívánt egyes helyzetképeknél vigye az egérmutatót ezek fölé, és kattintson a Kijelölés vászonhoz lépésre.
    A kijelölt elemek mellett zöld pipa (Zöld színű pipa jel) jelenik meg.

    Több helyzetképet is kijelölhet bármely lapról.
  6. Kattintson a Kijelölt hozzáadása lehetőségre a zöld színű pipa jellel megjelölt helyzetképek bármelyik laphoz való hozzáadásához.
    Az Explain helyzetképeket ugyanúgy kezelheti, mint bármilyen más, manuálisan létrehozott megjelenítést a vásznon.
A helyzetképek finomhangolásához kattintson a Beállítások lehetőségre, és módosítsa a rendszer által elemzett oszlopokat és konfigurálja a kategória beállításait, például válassza ki a szegmensek minimális méretét.