Adatprofilok és szemantikai javaslatok

Adatkészlet létrehozásakor az Oracle Analytics oszlopszintű profilozást végez, hogy létrejöjjön egy, az adatai javításához vagy bővítéséhez használható szemantikai javaslatkészlet. Munkafüzetek létrehozásakor tudásbázis-kiegészítéseket is belefoglalhat az ábrázolásokba. Ezek az Adatok panelről adhatók hozzá.

Megjegyzés:

A tudásbázis-kiegészítések általában alapértelmezés szerint engedélyezve vannak, azonban a munkafüzetek szerkesztői engedélyezhetik vagy letilthatják őket azoknál az adatkészleteknél, amelyek az ő tulajdonukat képezik, vagy amelyekhez szerkesztési jogosultsággal rendelkeznek. Az Oracle Analytics nem biztosít automatikusan bővítési javaslatokat az adatfolyamból előállított adatkészletekhez. Ebben az esetben az adatkészlet tulajdonosának vagy adminisztrátorának először engedélyeznie kell a tudásbázis-bővítési beállítást az adatkészlethez. Lásd: Tudásbázis-kiegészítések engedélyezése adatkészletekhez.

Ezek a javaslatok azon alapulnak, hogy a rendszer automatikusan észlel egy adott szemantikai típust a profilozási lépés során. Például, a helyi tárgyterületeken alapuló adatkészletek profilozása egyszerű Legjobb N minta segítségével történik.

Ezek olyan szemantikus típusok kategóriái, mint a városnevekkel azonosított földrajzi helyek, a felismerhető mintázatok, mint a hitelkártyák, e-mail-címek és társadalombiztosítási számok, dátumok és ismétlődő minták. De létrehozhat saját egyéni szemantikai típusokat is.

Szemantikaitípus-kategóriák

A profilkészítést különböző szemantikai típusokhoz alkalmazzák.

A szemantikai típusok kategóriának profilkészítését az alábbiak azonosítására használják:

  • Földrajzi helyek, például városnevek.
  • Minták, például a hitelkártyaszámok vagy az e-mail-címek azonosításához.
  • Ismétlődő minták, például a kötőjellel elválasztott kifejezések adatai.

Szemantikai típusok javaslatai

Az adatkészlet javítására, egyedivé tételére vagy bővítésére vonatkozó javaslatokat az adatok típusa határozza meg.

Példák a szemantikai típusok javaslataira:

  • Bővítések – Új oszlop hozzáadása az adatokhoz, amely megfelel egy adott észlelt típusnak, például egy földrajzi helynek. Például népességi adatok hozzáadása egy városnál.
  • Oszlopok összefűzése – Amikor a rendszer két oszlopot észlel az adatkészletben, amelyek közül az egyik utóneveket, a másik pedig vezetékneveket tartalmaz, javasolja a nevek összefűzését egyetlen oszlopba. Például a vezeteknev_utónev oszlopba.
  • Szemantikai kivonatok – Amikor egy szemantikai típus altípusokból áll, például egy olyan us_phone amerikai telefonszámból, amely tartalmazza a körzetszámot is, a rendszer az altípus kivonatolását javasolja a saját oszlopába.
  • Rész kivonatolása – Ha a rendszer általános mintaelválasztót észlel az adatokban, javasolja az adott minta részeinek kivonatolását. Ha például a rendszer ismétlődő kötőjeles elválasztást észlel az adatokban, javasolja az egyes részek különálló oszlopokba való kivonatolását, hogy az adatok könnyebben felhasználhatók legyenek az elemzéshez.
  • Dátumok kivonatolása – Ha a rendszer dátumokat észlel, javasolja azoknak a dátumrészeknek a kivonatolását, amelyek javíthatják az adatok elemzését. Például a hét napja kivonatolható egy számla vagy vásárlás dátumából.
  • Teljes vagy részleges obfuszkálás/maszkolás/törlés – Ha a rendszer bizalmas mezőket észlel, például hitelkártyaszámot, javasolja az oszlop teljes vagy részleges maszkolását, vagy éppen az eltávolítását.

Felismert mintaalapú szemantikai típusok

A szemantikai típusok az adatokban talált minták alapján azonosíthatók.

A rendszer javaslatokat fűz ezekhez a szemantikai típusokhoz:

  • Dátumok (több mint 30 formátumban)
  • USA társadalombiztosítási számok (SSN)
  • Hitelkártyaszámok
  • Hitelkártya-attribútumok (CVV és lejárati dátum)
  • E-mail-címek
  • Észak-amerikai terv telefonszámai
  • USA-beli címek

Hivatkozás – Valamin alapuló szemantikai típusok

A szemantikai típusok felismerését a szolgáltatás által biztosított betöltött referenciaismeretek határozzák meg.

A rendszer referencián alapuló javaslatokat fűz ezekhez a szemantikai típusokhoz:

  • Országnevek
  • Országkódok
  • Államnevek (tartományok)
  • Államkódok
  • Megyék neve (illetékességek)
  • Városnevek (honosított nevek)
  • Irányítószámok

Javasolt bővítések

A javasolt bővítések a szemantikai típusokon alapulnak.

A bővítések a földrajzi elhelyezkedés hierarchiája szerint vannak meghatározva:

  • Ország
  • Tartomány (állam)
  • Illetékesség (megyei önkormányzat)
  • Földrajzi hosszúság
  • Földrajzi szélesség
  • Népesség
  • Tengerszint feletti magasság (méter)
  • Időzóna
  • ISO országkódok
  • Federal Information Processing Series (FIPS)
  • Országnév
  • Főváros
  • Földrész
  • GeoNames-azonosító
  • Beszélt nyelvek
  • Telefon országkódja
  • Irányítószám formátuma
  • Irányítószám-minta
  • Telefon országkódja
  • Pénznem neve
  • Pénznem rövidítése
  • Földrajzi legfelső szintű tartomány (GeoLTD)
  • Négyzetkilométer

Szükséges küszöbök

A profilkészítési folyamat meghatározott küszöbértékeket használ az adott szemantikai típusokkal kapcsolatos döntések meghozatalához.

Általános szabály, hogy az oszlopban lévő adatértékek 85%-ának teljesítenie kell az egyetlen szemantikai típusra vonatkozó feltételeket ahhoz, hogy a rendszer el tudja végezni az osztályozás meghatározását. Ennek eredményeképpen egy olyan oszlop, amelyik 70%-ban utóneveket, 30%-ban pedig „egyéb” adatokat tartalmaz, nem felel meg a küszöb iránti követelményeknek, ezért a rendszer nem tesz javaslatot.

Egyéni tudásbázis-javaslatok

Egyéni tudásbázis-javaslatok használatával javíthatja az Oracle Analytics rendszer tudásbázisát. Az egyéni tudásbázis lehetővé teszi Oracle Analytics szemantikai profilkészítője számára további, az adott iparágra jellemző szemantikai típus azonosítását, így még megfelelőbb és irányított bővítési javaslatok előállítását. Például felvehet olyan egyéni tudásbázis-hivatkozást, amely a vényköteles gyógyszereket az USP szerinti fájdalomcsillapító vagy opioid kategóriába sorolja.

Oktatóanyag ikon Oktatóanyag

Kérje meg az adiminsztrátort, hogy töltsön fel egyéni tudásbázisfájlokat az Oracle Analytics rendszerbe. Az adatkészletek bővítésekor az Oracle Analytics bővítési javaslatokat jelenít meg a szemantikai adatok alapján. Munkafüzetek létrehozásakor tudásbázis-kiegészítéseket is belefoglalhat az ábrázolásokba. Ezek az Adatok panelről adhatók hozzá.

Saját egyéni tudásbázisfájlok létrehozása

Szemantikai fájlok létrehozásakor kövesse az alábbi irányelveket:

  • Hozzon létre egy CSV vagy Microsoft Excel (XLSX) formátumú adatfájlt. Legfeljebb 250 MB méretű fájlt tölthet fel.
  • Töltse ki az első oszlopot azzal a kulccsal, amelyet az Oracle Analytics az adatok profilozásához használ. A kulcs lehet például egy nap részletességű dátum, amely lehetővé teszi az adatok pénzügyi év szerinti elemzését.
  • A többi oszlopot töltse ki a bővítési értékekkel.

Kérje meg az adiminsztrátort, hogy töltse fel ezt az egyéni tudásbázisfájlt az Oracle Analytics rendszerbe.

Példa: Üzleti időkeretek integrálása az adatokba

Ez a példa azt szemlélteti, hogyan adhat hozzá üzleti időkereteket az értékesítési adatokhoz, és hogyan engedélyezheti az értékesítések pénzügyi év szerinti elemzését, ha az eredeti adatkészlet nem tartalmaz pénzügyi adatokat.

A példaábrázoláson a 2019-es, a 2020-as, a 2021-es, a 2022-es és a 2023-as évek láthatók, amelyen minden év más színnel jelenik meg. A forrás értékesítési adatok nem tartalmaznak pénzügyi adatokat, ezért további egyéni tudásbázist telepít, hogy pénzügyi adatokat adjon hozzá az adatkészletéhez.

Először is, előkészíti a pénzügyi adatokat a Fiscal Calendar.xlsx fájlban. A fájl tartalmazza a dátumot (nn-hh-éééé), a pénzügyi évet, a pénzügyi hónapot és a pénzügyi hetet. Például a forrásfájlban szerepelhet 01-23-2025 a dátum oszlopban, 2025 a pénzügyi év oszlopban, valamint a fennmaradó oszlopok kitöltéséhez szükséges attribútumok.

Kérje meg a rendszergazdát, hogy töltse fel a Fiscal Calendar.xlsx fájlt a Konzol egyéni tudásbázis-területére.

Ezután hozzon létre egy Értékesítés és egy ORDER_DATE elemet tartalmazó adatkészletet, és az adatkészlet-szerkesztőben válassza az ORDER_DATE bővítése pénzügyi évvel és az ORDER_DATE bővítése pénzügyi hónappal elemet a bővítési javaslatokban. Az Oracle Analytics hozzáadja ezt a két kiegészítést az adatkészlethez.

Végül hozzon létre egy munkafüzetet, és adja hozzá az ábrázoláshoz a Pénzügyi év, a Pénzügyi negyedév (az ORDER_DATE alatt) és az Értékesítés értékeket. Megjegyzés: a Pénzügyi év és a Pénzügyi negyedév közvetlenül is hozzáadható anélkül, hogy hozzá kellene adni az eredeti ORDER_DATE oszlopot.