Med funksjoner for databaseanalyse kan du utføre avanserte analyser og datautvinningsanalyser. Du kan for eksempel oppdage uregelmessigheter, klynging av data, dataprøver og affinitetsanalyse. Analysefunksjoner er tilgjengelige når du kobler til en Oracle-database eller Oracle Autonomous Data Warehouse.
Hvis du vil vise trinnet Databaseanalyse i redigeringsprogrammet for dataflyt, må du koble til en Oracle-database eller Oracle Autonomous Data Warehouse.
Funksjonstyper | Beskrivelse |
---|---|
Dynamisk sporing av uregelmessigheter |
Oppdag uregelmessigheter i inndataene uten en forhåndsdefinert modell. Du kan for eksempel ønske å utheve uvanlige økonomiske transaksjoner. Når du implementerer denne funksjonen med store datasett, må du konfigurere partisjonskolonnene slik at ytelsen blir maksimert. |
Dynamisk klynging |
Opprett klynger av inndataene uten en forhåndsdefinert modell. Du kan for eksempel ønske å karakterisere og oppdage kundesegmenter til markedsføringsformål. Når du implementerer denne funksjonen med store datasett, må du konfigurere partisjonskolonnene slik at ytelsen blir maksimert. |
Hyppig elementsett |
Oppdag relasjoner i dataene ved å identifisere sett med elementer som ofte vises sammen. Denne datautvinningsteknikken er også kjent som læring av tilknytningsregler, affinitetsanalyse eller analyse av markedskurv (innen detaljhandel). Hvis du bruker hyppig elementsett som et verktøy for analyse av markedskurv, finner du kanskje ut at kunder som kjøper sjampo, også kjøper balsam. Denne operasjonen er ressursintensiv, og ytelsen avhenger av flere faktorer, for eksempel volumet for inndatasettet, kardinaliteten til transaksjons-ID-en og kardinaliteten til elementverdikolonnen. Hvis du vil unngå potensiell reduksjon av databaseytelsen, kan du prøve med en høyere verdi for laveste støtteprosent (standardverdien er 0,25) og gradvis redusere den til en verdi som gir flere elementsett i utdataene. |
Eksempeldata |
Velg en tilfeldig eksempelprosent av data fra en tabell. Du angir ganske enkelt prosentandelen av data du vil prøve. Du kan for eksempel ønske å bruke et tilfeldig eksempel av ti prosent av dataene. |
Tekstsymbolisering |
Analyser tekstdata ved å bryte dem ned til distinkte ord og telle forekomstene av hvert enkelt ord. Når du kjører dataflyten, oppretter Oracle Analytics en tabell i databasen med navnet DR$IndexName$I, som inneholder symbolteksten og detaljene knyttet til symbolantall. Bruk tabellen DR$IndexName$I til å opprette et datasett.
Databasetilkoblingen du bruker til dataflyten, må ha bestemte dataprivilegier. Spør administratoren om følgende er tilfellet:
|
Tidsserie |
Tidsserie er en datautvinningsteknikk som forutser målverdier basert på en kjent historikk for målverdier. Inndataene for tidsserieanalyser er en sekvens med målverdier. Dette beregner målverdien for hver periode i et tidsvindu som kan omfatte opptil 30 perioder utover de historiske dataene. Modellen beregner også ulik statistikk som måler tilpasningsgraden for historiske data. Denne statistikken er tilgjengelig som et ekstra datasett for utdata via en parameterinnstilling. Merknad: Tidsseriealgoritmen er bare tilgjengelig fra Oracle Database versjon 18c og nyere. |
Oppheve pivotering av data |
Transponer data som er lagret i kolonner til radformat. Du kan for eksempel ønske å transponere flere kolonner som viser en metrisk omsetningsverdi for hvert år til en enkelt omsetningskolonne med flere verdirader for årsdimensjonen. Du velger ganske enkelt målingskolonnene du vil transponere, og angir et navn på den nye kolonnen. Du får et nytt datasett med færre kolonner og flere rader. |
Merknad: Hvis du skal bruke analysefunksjoner, må du forsikre deg om at administratoren har aktivert analysefunksjoner (via Konsoll, Avanserte systeminnstillinger, Ytelse og kompatibilitet, Aktiver knutepunktet for databaseanalyse i Dataflyter).