Funkcije analitike baze podataka

Funkcije analitike baze podataka omogućuju vam izvođenje naprednih analiza i analiza rudarenja podataka, na primjer, otkrivanje nepravilnosti, klasteriranje podataka, uzorkovanje podataka i analizu afiniteta. Funkcije analitike dostupne su kad se spojite na servis Oracle Database ili Oracle Autonomous Data Warehouse.

Ikona vodiča LiveLabs Sprint

Za prikaz koraka Database Analytics u uređivaču tijeka podataka morate se spojiti s Oracle bazom podataka ili servisom Oracle Autonomous Data Warehouse.

Vrste funkcija Opis

Dinamično otkrivanje nepravilnosti

Prepoznajte nepravilnosti u ulaznim podacima bez unaprijed definiranog modela. Možda ćete, na primjer, htjeti istaknuti neobične financijske transakcije.

Kad ovu funkciju primjenjujete na velike skupove podataka, konfigurirajte stupce particije kako biste poboljšali izvedbu.

Dinamično klasteriranje

Klasterirajte ulazne podatke bez unaprijed definiranog modela. Možda ćete, na primjer, htjeti karakterizirati i otkriti korisničke segmente u marketinške svrhe.

Kad ovu funkciju primjenjujete na velike skupove podataka, konfigurirajte stupce particije kako biste poboljšali izvedbu.

Skup čestih stavki

Otkrijte odnose u podacima identificirajući skupove stavki koje se često pojavljuju zajedno. Ova tehnika rudarenja podataka poznata je i kao učenje pravila povezivanja, analiza afiniteta ili u maloprodajnoj industriji kao analiza potrošačke košarice. Ako upotrebljavate skup čestih stavki kao alat za analizu potrošačke košarice, mogli biste otkriti da kupci koji kupuju šampon kupuju i regenerator za kosu.

Ova operacija zahtijeva mnogo resursa i njezina izvedba ovisi o nekoliko čimbenika, kao što su količina ulaznog skupa podataka, kardinalnosti ID-a transakcije i kardinalnosti stupca Vrijednost proizvoda. Kako biste izbjegli potencijalnu pogoršanje izvedbe baze podataka, pokušajte s većom vrijednošću minimalnog postotka podrške (zadana vrijednost je 0,25) i postupno je smanjujte kako biste smjestili više skupova proizvoda u izlazne proizvode.

Uzorkovanje podataka

Odabire nasumični postotak uzorka podataka iz tablice. Možete jednostavno odrediti postotak podataka koji želite uzorkovati. Možda ćete, na primjer, htjeti nasumično uzorkovati deset posto podataka.

Tokenizacija teksta

Analizirajte tekstne podatke raščlanjujući ih na različite riječi i brojeći pojave svake riječi. Kada pokrenete tijek podataka, Oracle Analytics stvara tablicu u bazi podataka pod nazivom DR$IndexName$I, koja sadrži tekst tokena i pojedinosti povezane s brojem tokena. Upotrijebite tablicu DR$IndexName$I za stvaranje skupa podataka.

  • Pod Izlazni proizvodi upotrijebite opciju Stvori pored svakog polja za odabir stupaca za indeksiranje.

  • Pod Parametri, zatim Tekstni stupac pritisnite Odabir stupca za odabir polja koje želite rastaviti na zasebne riječi. Upotrijebite opcije Referentni stupac<broj> kako biste uključili jedan ili više stupaca u izlazni skup podataka. S pomoću opcije Upotrijebi posebni leksički analizator odaberite specifične jezike poput kineskog, danskog, nizozemskog, engleskog, finskog, njemačkog, norveškog, japanskog, korejskog i švedskoj za posebne leksičke analizatore. U odjeljku Dokumentacija o servisu Oracle Database potražite više pojedinosti o podržanim jezicima.

Veza baze podataka koju upotrebljavate za tijek podataka zahtijeva posebne povlastice baze podataka. Provjerite sljedeće sa svojim administratorom:
  • Račun baze podataka ima Odobri EXECUTE na CTXSYS.CTX_DDL za naziv scheme.
  • Upotrebljavate vezu servisa Oracle Analytics s istim korisničkim imenom kao shema u kojoj postoji izvorna tablica. Ovo je najbolja praksa za izbjegavanje problema s povlasticama za pristup tijekom izvođenja tijeka podataka.
  • Stupac tablice baze podataka koji analizirate nema postojeći indeks CONTEXT. Ako u tablici baze podataka postoji postojeći indeks CONTEXT koji analizirate, uklonite taj indeks prije pokretanja tijeka podataka tokenizacije teksta.

Vremenska serija

Vremenska serija tehnika je rudarenja podataka koja predviđa ciljanu vrijednost na temelju poznatih prethodnih vrijednosti ciljnih vrijednosti. Ulaz u analizu vremenske serije niz je ciljnih vrijednosti. Pruža procjenu ciljne vrijednosti za svako vremensko razdoblje koje može uključivati do 30 razdoblja nakon prethodnih podataka.

Model računa i različite statistike koje mjere prikladnost s prethodnim podacima. Ta statistika dostupna je kako dodatni izlazni skup podataka putem postavke za parametar.

Napomena: Algoritam vremenske serije dostupan je samo u Oracle bazi podataka verzije 18c ili novije.

Poništavanje zaokretanja podataka

Podatke koji su spremljeni u stupce prebacite u retke. Možda ćete, na primjer, više stupaca u kojima se prikazuju vrijednosti metrike prihoda za svaku godinu htjeti prebaciti u jedan stupac prihoda s redcima s različitim vrijednostima za dimenziju godine. Možete jednostavno odabrati stupce metrike koje želite prebaciti te navesti naziv za novi stupac. Dobit ćete novi skup podataka s manje stupaca i više redaka.

Napomena: da biste upotrebljavali funkcije analitike, provjerite je li administrator omogućio funkcije analitike (pogledajte opcije Konzola, Napredne postavke sustava, Izvedba i kompatibilnost, Omogućavanje čvora analitike baze podataka u tijekovima podataka).