Funksjoner for databaseanalyse

Med funksjoner for databaseanalyse kan du utføre avanserte analyser og datautvinningsanalyser. Du kan for eksempel oppdage uregelmessigheter, klynging av data, dataprøver og affinitetsanalyse. Analysefunksjoner er tilgjengelige når du kobler til en Oracle-database eller Oracle Autonomous Data Warehouse.

Opplæringsikon LiveLabs Sprint

Hvis du vil vise trinnet Databaseanalyse i redigeringsprogrammet for dataflyt, må du koble til en Oracle-database eller Oracle Autonomous Data Warehouse.

Funksjonstyper Beskrivelse

Dynamisk sporing av uregelmessigheter

Oppdag uregelmessigheter i inndataene uten en forhåndsdefinert modell. Du kan for eksempel ønske å utheve uvanlige økonomiske transaksjoner.

Når du implementerer denne funksjonen med store datasett, må du konfigurere partisjonskolonnene slik at ytelsen blir maksimert.

Dynamisk klynging

Opprett klynger av inndataene uten en forhåndsdefinert modell. Du kan for eksempel ønske å karakterisere og oppdage kundesegmenter til markedsføringsformål.

Når du implementerer denne funksjonen med store datasett, må du konfigurere partisjonskolonnene slik at ytelsen blir maksimert.

Hyppig elementsett

Oppdag relasjoner i dataene ved å identifisere sett med elementer som ofte vises sammen. Denne datautvinningsteknikken er også kjent som læring av tilknytningsregler, affinitetsanalyse eller analyse av markedskurv (innen detaljhandel). Hvis du bruker hyppig elementsett som et verktøy for analyse av markedskurv, finner du kanskje ut at kunder som kjøper sjampo, også kjøper balsam.

Denne operasjonen er ressursintensiv, og ytelsen avhenger av flere faktorer, for eksempel volumet for inndatasettet, kardinaliteten til transaksjons-ID-en og kardinaliteten til elementverdikolonnen. Hvis du vil unngå potensiell reduksjon av databaseytelsen, kan du prøve med en høyere verdi for laveste støtteprosent (standardverdien er 0,25) og gradvis redusere den til en verdi som gir flere elementsett i utdataene.

Eksempeldata

Velg en tilfeldig eksempelprosent av data fra en tabell. Du angir ganske enkelt prosentandelen av data du vil prøve. Du kan for eksempel ønske å bruke et tilfeldig eksempel av ti prosent av dataene.

Tekstsymbolisering

Analyser tekstdata ved å bryte dem ned til distinkte ord og telle forekomstene av hvert enkelt ord. Når du kjører dataflyten, oppretter Oracle Analytics en tabell i databasen med navnet DR$IndexName$I, som inneholder symbolteksten og detaljene knyttet til symbolantall. Bruk tabellen DR$IndexName$I til å opprette et datasett.

  • Bruk valget Opprett ved siden av hvert enkelt felt under Utdata til å velge kolonnene som skal indekseres.

  • Klikk på Velg en kolonne under Parametre og deretter Tekstkolonne for å velge feltet du vil bryte ned til separate ord. Bruk valget Referansekolonne<nummer> til å ta med én eller flere kolonner i utdatasettet. Bruk valget Bruk spesiell leksikalsk analysator for språk til å velge spesifikke språk som kinesisk, dansk, nederlandsk, engelsk, finsk, tysk, norsk, japansk, koreansk og svensk for spesielle leksikalske analysatorer. Se Oracle Database-dokumentasjon hvis du vil vite mer om språkene som støttes.

Databasetilkoblingen du bruker til dataflyten, må ha bestemte dataprivilegier. Spør administratoren om følgende er tilfellet:
  • Databasekontoen har grant EXECUTE on CTXSYS.CTX_DDL to schema name.
  • Du bruker en Oracle Analytics-tilkobling med samme brukernavn som skjemaet der tabellen finnes. Dette er anbefalt fremgangsmåte for å unngå problemer med tilgangsprivilegier når dataflyten kjører.
  • Det finnes ingen CONTEXT-indeks i databasetabellkolonnen du analyserer. Hvis det finnes en CONTEXT-indeks i databasetabellen du analyserer, må du fjerne indeksen før du kjører dataflyten for tekstsymbolisering.

Tidsserie

Tidsserie er en datautvinningsteknikk som forutser målverdier basert på en kjent historikk for målverdier. Inndataene for tidsserieanalyser er en sekvens med målverdier. Dette beregner målverdien for hver periode i et tidsvindu som kan omfatte opptil 30 perioder utover de historiske dataene.

Modellen beregner også ulik statistikk som måler tilpasningsgraden for historiske data. Denne statistikken er tilgjengelig som et ekstra datasett for utdata via en parameterinnstilling.

Merknad: Tidsseriealgoritmen er bare tilgjengelig fra Oracle Database versjon 18c og nyere.

Oppheve pivotering av data

Transponer data som er lagret i kolonner til radformat. Du kan for eksempel ønske å transponere flere kolonner som viser en metrisk omsetningsverdi for hvert år til en enkelt omsetningskolonne med flere verdirader for årsdimensjonen. Du velger ganske enkelt målingskolonnene du vil transponere, og angir et navn på den nye kolonnen. Du får et nytt datasett med færre kolonner og flere rader.

Merknad: Hvis du skal bruke analysefunksjoner, må du forsikre deg om at administratoren har aktivert analysefunksjoner (via Konsoll, Avanserte systeminnstillinger, Ytelse og kompatibilitet, Aktiver knutepunktet for databaseanalyse i Dataflyter).