Tietokanta-analyysitoiminnot

Tietokanta-analyysitoimintojen avulla voit tehdä kehittyneitä analyysejä ja tiedonlouhinta-analyysejä, esimerkiksi poikkeamientunnistus-, tietojenklusterointi-, näytteenottotieto- ja yhtäläisyysanalyysejä. Analyysitoiminnot ovat käytettävissä, kun yhdistät Oracle-tietokantaan tai Oracle Autonomous Data Warehouse -palveluun.

Opastuskuvake LiveLabs-kehitysjakso

Jos haluat näyttää Tietokanta-analyysi-vaiheen tietovirtaeditorissa, on muodostettava yhteys Oracle-tietokantaan tai Oracle Autonomous Data Warehouse -palveluun.

Toimintotyypit Kuvaus

Dynaaminen poikkeamien tunnistus

Havaitse poikkeukset syötetiedoissa ilman esimääritettyä mallia. Voit esimerkiksi korostaa epätavallisia taloudellisia tapahtumia.

Kun otat tämän toiminnon käyttöön suurissa tietojoukoissa, konfiguroi ositussarakkeet, jotta suorituskyky olisi paras mahdollinen.

Dynaaminen ryppäiden luonti

Luo ryppäitä syötetiedoista ilman esimääritettyä mallia. Voit esimerkiksi määritellä ja löytää asiakassegmenttejä markkinointia varten.

Kun otat tämän toiminnon käyttöön suurissa tietojoukoissa, konfiguroi ositussarakkeet, jotta suorituskyky olisi paras mahdollinen.

Toistuva nimikejoukko

Havaitse suhteet tiedoissa tunnistamalla usein yhdessä näkyvät nimikejoukot. Tätä tietojenlouhintatekniikkaa kutsutaan myös liitossääntöjen oppimiseksi, yhtäläisyysanalyysiksi tai vähittäiskaupassa ostoskorianalyysiksi. Jos käytät toistuvia nimikejoukkoja ostokorianalyysin työkaluna, saatat huomata, että asiakkaat, jotka ostavat shampoota, ostavat myös hoitoainetta.

Tämä toiminto vaatii paljon resursseja, ja sen suorituskyky riippuu useista tekijöistä, kuten syötetietojoukkojen koosta, tapahtuman tunnusten kardinaliteetista ja nimikearvosarakkeen kardinaliteetista. Vältä tietokannan suorituskyvyn mahdollinen heikkeneminen kokeilemalla korkeampaa vähimmäistuen prosenttiarvoa (oletus on 0,25) ja vähitellen pienentämällä sitä tulosteen lisänimikejoukkojen mukaan.

Näytetiedot

Valitsee taulusta prosenttiosuuden tiedoista satunnaiseksi näytteeksi. Määritä vain, mikä on näytteeksi valittavien tietojen prosenttiosuus. Voit esimerkiksi valita 10 prosenttia tiedoista satunnaiseksi näytteeksi.

Tekstin jako osiin

Analysoi tekstimuotoiset tiedot jakamalla ne erillisiin sanoihin ja laskemalla kunkin sanan esiintymät. Kun ajat tietovirran, Oracle Analytics luo tietokantaan taulun nimeltä DR$IndexName$I, jossa on osien tekstiin ja määrään liittyviä tietoja. Käytä DR$IndexName$I -taulua tietojoukon luonnissa.

  • Valitse indeksoitavat sarakkeet valitsemalla Tulosteet-kohdassa kunkin kentän vieressä olevaa Luo-valintaa.

  • Valitse kenttä, jonka haluat purkaa erillisiin sanoihin, valitsemalla Parametrit, Tekstisarake ja Valitse sarake. Lisää vähintään yksi sarake tulostetietojoukkoon käyttämällä Viitesarake <number> -valintoja. Käytä erityiskielen lexeriä -valinnalla voit valita erityislexereille tiettyjä kieliä, kuten kiinan, tanskan, hollannin, englannin, suomen, saksan, norjan, japanin, korean ja ruotsin. Katso kohdasta Oracle Database -dokumentaatio lisätietoja tuetuista kielistä.

Tietovirrassa käyttämäsi tietokantayhteys vaatii tietokannan käytön erityisoikeudet. Tarkista pääkäyttäjältä seuraavat tiedot:
  • Tietokantatilissäsi on grant EXECUTE on CTXSYS.CTX_DDL to schema name.
  • Käytät Oracle Analytics -yhteyttä samalla käyttäjätunnuksella kuin kaavaa, jossa lähdetaulu on. Tämä on paras käytäntö välttää käyttöoikeusongelmia tietovirtojen ajon aikana.
  • Analysoitavassa tietokannan taulusarakkeessa ei ole CONTEXT-indeksiä. Jos analysoitavassa tietokantataulussa on CONTEXT-indeksi, poista se ennen tekstiin osiinjaon tietovirran ajoa.

Aikasarja

Aikasarja on analysoiva tiedonhakutekniikka, joka ennustaa kohdearvon kohdearvojen tunnetun historian perusteella. Aikasarja-analyysin syöte on kohdearvojen sarja. Se tuottaa arvioita kohdearvosta kullekin aikavälin jaksolle. Aikaväli voi sisältää jopa 30 jaksoa yli historiatietojen.

Malli laskee myös erilaisia tilastotietoja, jotka mittaavat yhteensopivuutta historiatietoihin. Nämä tilastotiedot ovat käytettävissä ylimääräisenä tulostuksen tietojoukkona parametriasetuksen avulla.

Huomautus: aikasarja-algoritmi on käytettävissä vain Oracle-tietokannan versiossa 18c ja sitä uudemmissa versioissa.

Tietojen pivotoinnin poisto

Muunna sarakkeisiin tallennetut tiedot rivimuotoisiksi. Jos esimerkiksi kunkin vuoden tuoton mittariarvot ovat useassa sarakkeessa, voit muuntaa sarakkeet yhdeksi tuottosarakkeeksi, jossa on useita arvorivejä vuosidimensiolle. Valitse muunnettavat mittarisarakkeet ja määritä uudelle sarakkeelle nimi. Tuloksena on uusi tietojoukko, jossa on vähemmän sarakkeita ja enemmän rivejä.

Huomautus: Jotta voit käyttää analyysitoimintoja, varmista, että järjestelmänvalvoja on ottanut analyysitoiminnot käyttöön (Konsoli, Järjestelmän lisäasetukset, Suorituskyky ja yhteensopivuus, Ota käyttöön tietokannan Analytics-solmu tietovirroissa).