Bővítés és átalakítás – Hivatkozás

A használati útmutató segítséget nyújt adatainak bővítéséhez és átalakításához.

Hivatkozás átalakítása

Ismerje meg az átalakításszerkesztő adatátalakítási lehetőségeit. Például, ha egy verseny köridejeit szeretné kategorizálni egy adatkészleti oszlopban, használja a Rekesz lehetőséget.

Az átalakítási opciók kiválasztásához az átalakításszerkesztőben nyissa meg az adatkészletet, majd kattintson a Beállítások elemre (az adatoszlop jobb felső sarkában lévő három pont Három pont), és válasszon egy opciót (például Rekesz, Átnevezés vagy Szöveggé alakítás).


A(z) GUID-48DD220C-19D2-4614-9E6B-ABE498632724-default.png leírása
.png ábra leírása

Beállítás Leírás
Rekesz Saját egyéni csoportok létrehozása a számtartományokhoz. Például létrehozhat rekeszeket az Életkor oszlophoz, ahol az életkortartományok felosztása egyéni követelmények alapján a következő: kiskamasz, fiatal felnőtt, felnőtt, idős.
Időtartam kiszámítása Két dátum vagy időpont közötti időtartam kiszámítása. Például rendelések kiszállítási idejének elemzéséhez kiszámíthatja az ORDER_DATE és a DELIVERY_DATE értékek között eltelt napok számát.
Dátummá alakítás Az oszlop adattípusának dátummá alakítása, és minden olyan érték törlése az oszlopból, amely nem dátum.
Számmá alakítás Az oszlop adattípusának számmá alakítása, és minden olyan érték törlése az oszlopból, amely nem szám.
Szöveggé alakítás Az oszlop adattípusának szöveg értékűre módosítása.
Létrehozás Oszlop létrehozása függvény alapján.
Megkettőzés Oszlop létrehozása a kiválasztott oszlopéval azonos tartalommal.
Szerkesztés Az oszlop adatainak módosítása. Például megváltoztathatja a nevet, kijelölhet egy másik oszlopot vagy módosíthatja a függvényeket.
Dátum kivonatolása A dátum- és időadatok kivonatolása az időbélyegekből. Például kivonatolhatja az Évet mint 2024, a Hónap napját mint 23, vagy a Nap óráját 15 óraként.
Csoport, Feltételi csoport Válassza ki a Csoport lehetőséget az Ön saját egyéni csoportjainak létrehozására. Például az Államok együtt csoportosíthatók az egyéni régiókkal, és a dollárösszegek is csoportokba kategorizálhatók, például: kicsi, közepes, illetve nagy.
Elrejtés Az oszlop elrejtése az Adatok panelen és az ábrázolásokon. Ha látni szeretné a rejtett oszlopokat, kattintson a Rejtett oszlopok (kísértet) ikonra az oldal láblécében. A rejtett oszlopok felfedhetők egyenként vagy egyszerre az összes.
Log Egy szám értékű kifejezés természetes alapú logaritmusának kiszámítása.
Kisbetű Egy oldal tartalmának módosítása úgy, hogy minden értéket kisbetűsre változtat.
Hatvány Az oszlop értékeinek az Ön által megadott hatványra emelése. Az alapértelmezett hatvány a 2.
Átnevezés Egy oszlop nevének módosítása.
Csere A kiválasztott oszlopban lévő adott szöveget bármilyen más megadott értékre módosítja. Például a Mister összes előfordulását Mr. értékre cseréli.
Mondatkezdő nagybetű Egy oldal tartalmát úgy módosítja, hogy a mondatok első szavának első betűjét nagybetűsre cseréli.
Felosztás Egy oszlopértéket részekre oszt fel. Például feloszthat egy Név nevű oszlopot utónévre és vezetéknévre.
Négyzetgyök Oszlop létrehozása a kiválasztott oszlop értékeinek négyzetgyökével feltöltve.
Nagybetű Egy oldal tartalmát úgy módosítja, hogy minden értéket nagybetűsre változtat.

Adatprofilok és szemantikai javaslatok

Adatkészlet létrehozásakor az Oracle Analytics oszlopszintű profilozást végez, hogy létrejöjjön egy, az adatai javításához vagy bővítéséhez használható szemantikai javaslatkészlet. Munkafüzetek létrehozásakor tudásbázis-kiegészítéseket is belefoglalhat az ábrázolásokba. Ezek az Adatok panelről adhatók hozzá.

Ezek a javaslatok azon alapulnak, hogy a rendszer automatikusan észlel egy adott szemantikai típust a profilozási lépés során. Például, a helyi tárgyterületeken alapuló adatkészletek profilozása egyszerű Legjobb N minta segítségével történik.

Ezek olyan szemantikus típusok kategóriái, mint a városnevekkel azonosított földrajzi helyek, a felismerhető mintázatok, mint a hitelkártyák, e-mail-címek és társadalombiztosítási számok, dátumok és ismétlődő minták. De létrehozhat saját egyéni szemantikai típusokat is.

Szemantikaitípus-kategóriák

A profilkészítést különböző szemantikai típusokhoz alkalmazzák.

A szemantikai típusok kategóriának profilkészítését az alábbiak azonosítására használják:

  • Földrajzi helyek, például városnevek.
  • Minták, például a hitelkártyaszámok vagy az e-mail-címek azonosításához.
  • Ismétlődő minták, például a kötőjellel elválasztott kifejezések adatai.

Szemantikai típusok javaslatai

Az adatkészlet javítására, egyedivé tételére vagy bővítésére vonatkozó javaslatokat az adatok típusa határozza meg.

Példák a szemantikai típusok javaslataira:

  • Bővítések – Új oszlop hozzáadása az adatokhoz, amely megfelel egy adott észlelt típusnak, például egy földrajzi helynek. Például népességi adatok hozzáadása egy városnál.
  • Oszlopok összefűzése – Amikor a rendszer két oszlopot észlel az adatkészletben, amelyek közül az egyik utóneveket, a másik pedig vezetékneveket tartalmaz, javasolja a nevek összefűzését egyetlen oszlopba. Például a vezeteknev_utónev oszlopba.
  • Szemantikai kivonatok – Amikor egy szemantikai típus altípusokból áll, például egy olyan us_phone amerikai telefonszámból, amely tartalmazza a körzetszámot is, a rendszer az altípus kivonatolását javasolja a saját oszlopába.
  • Rész kivonatolása – Ha a rendszer általános mintaelválasztót észlel az adatokban, javasolja az adott minta részeinek kivonatolását. Ha például a rendszer ismétlődő kötőjeles elválasztást észlel az adatokban, javasolja az egyes részek különálló oszlopokba való kivonatolását, hogy az adatok könnyebben felhasználhatók legyenek az elemzéshez.
  • Dátumok kivonatolása – Ha a rendszer dátumokat észlel, javasolja azoknak a dátumrészeknek a kivonatolását, amelyek javíthatják az adatok elemzését. Például a hét napja kivonatolható egy számla vagy vásárlás dátumából.
  • Teljes vagy részleges obfuszkálás/maszkolás/törlés – Ha a rendszer bizalmas mezőket észlel, például hitelkártyaszámot, javasolja az oszlop teljes vagy részleges maszkolását, vagy éppen az eltávolítását.

Felismert mintaalapú szemantikai típusok

A szemantikai típusok az adatokban talált minták alapján azonosíthatók.

A rendszer javaslatokat fűz ezekhez a szemantikai típusokhoz:

  • Dátumok (több mint 30 formátumban)
  • USA társadalombiztosítási számok (SSN)
  • Hitelkártyaszámok
  • Hitelkártya-attribútumok (CVV és lejárati dátum)
  • E-mail-címek
  • Észak-amerikai terv telefonszámai
  • USA-beli címek

Hivatkozás – Valamin alapuló szemantikai típusok

A szemantikai típusok felismerését a szolgáltatás által biztosított betöltött referenciaismeretek határozzák meg.

A rendszer referencián alapuló javaslatokat fűz ezekhez a szemantikai típusokhoz:

  • Országnevek
  • Országkódok
  • Államnevek (tartományok)
  • Államkódok
  • Megyék neve (illetékességek)
  • Városnevek (honosított nevek)
  • Irányítószámok

Javasolt bővítések

A javasolt bővítések a szemantikai típusokon alapulnak.

A bővítések a földrajzi elhelyezkedés hierarchiája szerint vannak meghatározva:

  • Ország
  • Tartomány (állam)
  • Illetékesség (megyei önkormányzat)
  • Földrajzi hosszúság
  • Földrajzi szélesség
  • Népesség
  • Tengerszint feletti magasság (méter)
  • Időzóna
  • ISO országkódok
  • Federal Information Processing Series (FIPS)
  • Országnév
  • Főváros
  • Földrész
  • GeoNames-azonosító
  • Beszélt nyelvek
  • Telefon országkódja
  • Irányítószám formátuma
  • Irányítószám-minta
  • Telefon országkódja
  • Pénznem neve
  • Pénznem rövidítése
  • Földrajzi legfelső szintű tartomány (GeoLTD)
  • Négyzetkilométer

Szükséges küszöbök

A profilkészítési folyamat meghatározott küszöbértékeket használ az adott szemantikai típusokkal kapcsolatos döntések meghozatalához.

Általános szabály, hogy az oszlopban lévő adatértékek 85%-ának teljesítenie kell az egyetlen szemantikai típusra vonatkozó feltételeket ahhoz, hogy a rendszer el tudja végezni az osztályozás meghatározását. Ennek eredményeképpen egy olyan oszlop, amelyik 70%-ban utóneveket, 30%-ban pedig „egyéb” adatokat tartalmaz, nem felel meg a küszöb iránti követelményeknek, ezért a rendszer nem tesz javaslatot.

Egyéni tudásbázis-javaslatok

Egyéni tudásbázis-javaslatok használatával javíthatja az Oracle Analytics rendszer tudásbázisát. Az egyéni tudásbázis lehetővé teszi Oracle Analytics szemantikai profilkészítője számára további, az adott iparágra jellemző szemantikai típus azonosítását, így még megfelelőbb és irányított bővítési javaslatok előállítását. Például felvehet olyan egyéni tudásbázis-hivatkozást, amely a vényköteles gyógyszereket az USP szerinti fájdalomcsillapító vagy opioid kategóriába sorolja.

Oktatóanyag ikon Oktatóanyag

Használhat meglévő szemantikai fájlokat, például Unsupervised Semantic Parsing (USP) fájlokat, vagy létrehozhat saját szemantikai fájlokat. Kérje meg az adiminsztrátort, hogy töltsön fel egyéni tudásbázisfájlokat az Oracle Analytics rendszerbe. Az adatkészletek bővítésekor az Oracle Analytics bővítési javaslatokat jelenít meg a szemantikai adatok alapján. Munkafüzetek létrehozásakor tudásbázis-kiegészítéseket is belefoglalhat az ábrázolásokba. Ezek az Adatok panelről adhatók hozzá.

Saját egyéni tudásbázisfájlok létrehozása

Saját szemantikai fájlok létrehozásakor kövesse az alábbi irányelveket:

  • Hozzon létre egy CSV vagy Microsoft Excel (XLSX) formátumú adatfájlt. Legfeljebb 250 MB méretű fájlt tölthet fel.
  • Töltse ki az első oszlopot azzal a kulccsal, amelyet az Oracle Analytics az adatok profilozásához használ.
  • A többi oszlopot töltse ki a bővítési értékekkel.

Kérje meg az adiminsztrátort, hogy töltse fel ezt az egyéni tudásbázisfájlt az Oracle Analytics rendszerbe.

Általános egyéni formátumú karakterláncok

Általános, egyéni formátumú karakterláncokkal egyéni idő- vagy dátumformátumokat hozhat létre.

A táblázat az általános egyéni formátumú karakterláncokat és az általuk megjelenített eredményeket mutatja be. Ezekkel a karakterláncokkal a dátum- és időmezők a felhasználó nyelvi-területi beállításai szerint jeleníthetők meg.

Általános formátumú karakterlánc Eredmény

[FMT:dateShort]

A dátumot a nyelvi-területi beállítás rövid dátumformátumában adja meg. De beírhatja az [FMT:date] parancsot is.

[FMT:dateLong]

A dátumot a nyelvi-területi beállítás hosszú dátumformátumában adja meg.

[FMT:dateInput]

A dátumot olyan formátumban adja meg, amely elfogadható a rendszerbe való visszaíráshoz.

[FMT:time]

Az időt a nyelvi-területi beállítás időformátumában adja meg.

[FMT:timeHourMin]

Az időt a nyelvi-területi beállítás időformátumában adja meg, de a másodpercek nélkül.

[FMT:timeInput]

Az időt olyan formátumban adja meg, amely elfogadható a rendszerbe való visszaíráshoz.

[FMT:timeInputHourMin]

Az időt olyan formátumban adja meg, amely elfogadható a rendszerbe való visszaíráshoz, de a másodpercek nélkül.

[FMT:timeStampShort]

Egyenértékű az [FMT:dateShort] [FMT:time] parancs beírásával. A dátumot a nyelvi-területi beállítás rövid dátumformátumában, az időt pedig a nyelvi-területi beállítás időformátumában adja meg. De beírhatja az [FMT:timeStamp] parancsot is.

[FMT:timeStampLong]

Egyenértékű az [FMT:dateLong] [FMT:time] parancs beírásával. A dátumot a nyelvi-területi beállítás hosszú dátumformátumában, az időt pedig a nyelvi-területi beállítás időformátumában adja meg.

[FMT:timeStampInput]

Egyenértékű az [FMT:dateInput] [FMT:timeInput] parancs beírásával. A dátumot és az időt olyan formátumban adja meg, amely elfogadható a rendszerbe való visszaíráshoz.

[FMT:timeHour]

Csak az óramezőt adja meg nyelvi-területi beállítás formátumában, például du. 8 óra.

ÉÉ vagy éé

Az év utolsó két számjegyét jeleníti meg, például 2011 esetében 11.

ÉÉÉ vagy ééé

Az év utolsó három számjegyét jeleníti meg, például 2011 esetében 011.

ÉÉÉÉ vagy éééé

Az évszám négy számjegyét jeleníti meg, például 2011

H

A hónap számát jeleníti meg, például február esetében 2.

HH

A hónap számát jeleníti meg, az egy számjegyű hónapoknál a bal oldalon nullával feltöltve, például február esetében 02.

HHH

A hónap rövidített nevét jeleníti meg a felhasználó nyelvi-területi beállításainak megfelelően, például Feb.

HHHH

A hónap teljes nevét jeleníti meg a felhasználó nyelvi-területi beállításainak megfelelően, például Február.

N vagy n

A hónap napját jeleníti meg, például 1.

NN vagy nn

A hónap napját jeleníti meg, az egy számjegyű hónapoknál a bal oldalon nullával feltöltve, például 01.

NNN vagy nnn

A hét napjának rövidített nevét jeleníti meg a felhasználó nyelvi-területi beállításainak megfelelően, például csütörtök esetében Csü.

NNNN vagy nnnn

A hét napjának teljes nevét jeleníti meg a felhasználó nyelvi-területi beállításainak megfelelően, például Csütörtök.

NNNNN vagy nnnnn

A hét napjának a neve első betűjét jeleníti meg a felhasználó nyelvi-területi beállításainak megfelelően, például C.

r

Az év napját jeleníti meg, például 1.

rr

Az év napját jeleníti meg, az egy számjegyű napoknál a bal oldalon nullával feltöltve, például 01.

rrr

Az év napját jeleníti meg, az egy számjegyű napoknál a bal oldalon nullával feltöltve, például 001.

w

Az év hetét jeleníti meg, például 1.

ww

Az év hetét jeleníti meg, az egy számjegyű heteknél a bal oldalon nullával feltöltve, például 01.

q

A negyedévet jeleníti meg, például 4.

h

Az órát jeleníti meg 12 órás időformátumban, például 2.

H

Az órát jeleníti meg 24 órás időformátumban, például 23.

hh

Az órát jeleníti meg 12 órás időformátumban, az egy számjegyű óráknál a bal oldalon nullával feltöltve, például 01.

HH

Az órát jeleníti meg 24 órás időformátumban, az egy számjegyű óráknál a bal oldalon nullával feltöltve, például 23.

m

A percet jeleníti meg, például 7.

mm

A percet jeleníti meg, az egy számjegyű perceknél a bal oldalon nullával feltöltve, például 07.

s

A másodpercet jeleníti meg, például 2.

Tizedesszámokat is használhat a karakterláncban, például s.# vagy s.00 (ahol a # opcionális számjegyet, a 0 pedig kötelező számjegyet jelent).

ss

A másodpercet jeleníti meg, az egy számjegyű másodperceknél a bal oldalon nullával feltöltve, például 02.

Tizedesszámokat is használhat a karakterláncban, például ss.# vagy ss.00 (ahol a # opcionális számjegyet, a 0 pedig kötelező számjegyet jelent).

S

Az ezredmásodpercet jeleníti meg, például 2.

SS

Az ezredmásodpercet jeleníti meg, az egy számjegyű ezredmásodperceknél a bal oldalon nullával feltöltve, például 02.

SSS

Az ezredmásodpercet jeleníti meg, az egy számjegyű ezredmásodperceknél a bal oldalon nullával feltöltve, például 002.

tt

A délelőtt vagy délután rövidített változatát jeleníti meg a felhasználó nyelvi-területi beállításainak megfelelően, például du.

gg

A korszakot jeleníti meg a felhasználó nyelvi-területi beállításainak megfelelően.