Stvaranje i upotreba prognostičkih modela u servisu Oracle Analytics

Prognostički modeli Oracle Analytics upotrebljavaju nekoliko ugrađenih Oracle algoritama za strojno učenje za pretraživanje skupova podataka, predviđanje odredišne vrijednosti ili identificiranje klasa zapisa. Upotrijebite uređivač tijeka podataka kako biste stvorili, obučili i primijenili prognostičke modele na svoje podatke.

Što su prognostički modeli Oracle Analytics?

Prognostički modeli Oracle Analytics primjenjuju specifični algoritam na skupove podataka u cilju predviđanja vrijednosti, predviđanja klasa ili identificiranja grupa u podacima.

Za predviđanje podataka možete upotrijebiti i Oracle modele za strojno učenje.

Oracle Analytics obuhvaća algoritme koji pomažu s obukom prognostičkih modela u razne svrhe. Primjeri algoritama su klasifikacijski i regresijski ogranci (CART), logistička regresija i srednje k vrijednosti.

Uređivač tijeka podataka omogućava obuku modela za skup podataka obuke. Nakon obuke prognostičkog modela, primijenite ga na skupove podataka koje želite predvidjeti.

Obučeni model možete učiniti dostupnim drugim korisnicima koji ga mogu primijeniti na svoje podatke i predviđati vrijednosti. U određenim slučajevima, neki korisnici obučavaju modele, a drugi ih primjenjuju.

Bilješka:

Ako niste sigurni što u svojim podacima tražite, možete započeti pomoću funkcije Objasni koja upotrebljava strojno učenje za identificiranje trendova i uzoraka. Zatim možete upotrijebiti uređivač tijeka podataka kako biste stvorili i obučili prognostičke modele te analizirali trendove i uzorke koje je pronašla funkcija Objasni.
Model obučavate pomoću uređivača tijeka podataka:
  • Prvo izradite tijek podataka i dodajte skup podataka pomoću kojega želite obučiti model. Taj skup podataka za obuku sadrži podatke koje želite predvidjeti (npr., vrijednost poput prodaje ili dobi ili varijablu poput razdoblja kreditnog rizika).
  • Prema potrebi, pomoću uređivača tijeka podataka možete uređivati skupove podataka dodavanjem stupaca, odabirom stupaca, njihovim pridruživanjem itd.
  • Nakon što potvrdite kako imate podatke kojima želite obučavati model, možete dodati korak obuke za tijek podataka i odabrati klasifikaciju (binarna ili višestruka), regresiju ili algoritam klastera za obuku modela. Zatim odaberite naziv dobivenog modela, spremite tijek podataka i pokrenite ga u cilju obučavanja i izrade modela.
  • Provjerite svojstva objekata za strojno učenje kako biste utvrdili kvalitetu modela. Prema potrebi, postupak obuke možete izvoditi sve dok model ne dosegne željenu razinu kvalitete.

Pomoću gotovog modela bodujte nepoznate ili neoznačene podatke kako biste generirali skup podataka u tijeku podataka ili kako biste radnoj knjizi dodali vizualizaciju predviđanja.

Primjer

Recimo da želite izraditi i obučiti više-klasifikacijski model koji će predviđati kod kojih pacijenta postoji visok rizik od razvoja bolesti srca.

  1. Unesite skup podataka obuke s atributima pojedinačnih pacijenata poput njihove dobi, spola i faktora poput postojanja boli u prsima te metričke podatke poput krvnog tlaka, šećera u krvi natašte, kolesterola i maksimalnog broja otkucaja srca. Skup podataka obuke sadrži i stupac naziva "Vjerojatnost" kojemu se dodjeljuje jedna od sljedećih vrijednosti: ne postoji, manje vjerojatno, vjerojatno, jako vjerojatno ili postoji.
  2. Odaberite algoritam CART (stablo odlučivanja) budući da se njime zanemaruju redundantni stupci koji ne dodaju vrijednost predviđanju te se identificiraju i upotrebljavaju samo oni stupci koji su korisni u predviđanju cilja. Kad tijeku podataka dodate algoritam, odabrat ćete stupa Vjerojatnost za obuku modela. Algoritam upotrebljava strojno učenje te bira stupce pokretača koji su mu potrebni za izvođenje i prikaz predviđanja te srodnih skupova podataka.
  3. Pregledajte rezultate i prilagodite model obuke, a zatim model primijenite na veći skup podataka kako biste predvidjeli za koje pacijente postoji veća mogućnost od obolijevanja ili razvoja bolesti srca.

Kako odabrati algoritam prediktivnog modela?

Oracle Analytics pruža algoritme za sve potrebe modeliranja strojnog učenja: numeričko predviđanje, višestruku klasifikaciju, binarnu klasifikaciju i klasteriranje.

Oracleova funkcija strojnog učenja predviđena je za napredne analitičare podataka koji znaju što traže u podacima, koji su upoznati s praksom prognostičkih analiza i shvaćaju razlike između algoritama.

Bilješka:

Ako upotrebljavate podatke čiji je izvor Oracle Autonomous Data Warehouse, možete upotrebljavati AutoML mogućnost kako biste brzo i jednostavno pripremili prediktivni model za vas, bez potrebe za vještinama strojnog učenja. Pogledajte odjeljak Obuka prediktivnog modela s pomoću mogućnosti AutoML u servisu Autonomous Data Warehouse.

Korisnici obično žele stvoriti više modela predviđanja, usporediti ih i odabrati onaj koji će najvjerojatnije dati rezultate koji će ispuniti njihove kriterije i zahtjeve. Ti kriteriji mogu varirati. Npr., korisnici ponekad biraju modele veće ukupne točnosti, ponekad biraju modele s najmanje pogrešaka tipa I (lažno pozitivne stavke) i tipa II (lažno negativne stavke), a ponekad biraju modele koji rezultate vraćaju brže i uz prihvatljivu razinu točnosti, čak i ako rezultati nisu idealni.

Oracle Analytics sadrži više algoritama za strojno učenje za sve vrste predviđanja ili klasifikacija. Korisnici pomoću tih algoritama mogu stvoriti više modela ili upotrijebiti različite prilagođene parametre ili pak upotrijebiti različite ulazne skupove podataka za obuku, a zatim odabrati najbolji model. Korisnik može odabrati najbolji model usporedbom i ponderiranjem modela u odnosu na svoje vlastite kriterije. Kako bi odabrali najbolji model, korisnici mogu primijeniti model i vizualizirati rezultate izračuna kako bi utvrdili točnost ili mogu otvoriti i istražiti srodne skupove podataka pomoću kojih je Oracle Analytics modelirao izlaz.

U ovoj tablici saznajte više o omogućenim algoritmima:

Naziv Vrsta Kategorija Funkcija Opis
CART

Klasifikacija

Regresija

Binarna klasifikacija

Višestruka klasifikacija

Brojčani

- Pomoću stabala odlučivanja predviđa zasebne i kontinuirane vrijednosti.

Upotrijebite s velikim skupovima podataka.

Elastic Net linearna regresija Regresija Brojčani ElasticNet Napredno regresijsko modeliranje. Pruža dodatne informacije (regularizacija), provodi odabir varijabli i vrši linearne kombinacije. Kazneni bodovi regresijskih metoda Lasso i Ridge.

Pomoću velikog broja atributa izbjegnite kolinearnost (savršenu korelaciju više atributa) i prekomjerno definiranje.

Hijerarhijski Klasteriranje Klasteriranje AgglomerativeClustering Izrada hijerarhije klasteriranja odozdo prema gore (sve su opservacije zasebni klasteri koji se zatim spajaju) ili odozgo prema dolje (sve opservacije kreću kao jedan klaster) i metrike udaljenosti.

Upotrijebite ako skup podataka nije velik, a broj klastera prethodno je nepoznat.

Srednje K vrijednosti Klasteriranje Klasteriranje srednje k vrijednosti Iterativno dijeli zapise u K skupove kod kojih sve opservacije pripadaju skupu s najbližom srednjom vrijednošću.

Služi za stupce metrike klasteriranja, s postavljenim očekivanim brojem potrebnih klastera. Dobro funkcionira s velikim skupovima podataka. Rezultati se razlikuju sa svakim pokretanjem.

Linearna regresija Regresija Brojčani Standardni najmanji kvadrati

Ridge

Lasso

Linearan pristup odnosu modeliranja između ciljne varijable i drugih atributa u skupu podataka.

Služi za predviđanje numeričkih vrijednosti ako atributi nisu u savršenoj korelaciji.

Logistic Regression Regresija Binarna klasifikacija LogisticRegressionCV Služi za predviđanje vrijednosti kategorijski ovisnih varijabli. Ovisna varijabla je binarna varijabla koja sadrži podatke kodirane kao 1 ili 0.
Naive Bayes Klasifikacija

Binarna klasifikacija

Višestruka klasifikacija

GaussianNB Probabilistička klasifikacija utemeljena na Bayesevom teoremu koja ne pretpostavlja ovisnost među značajkama.

Upotrebljavajte u slučaju velikog broja ulaznih dimenzija.

Neuronska mreža Klasifikacija

Binarna klasifikacija

Višestruka klasifikacija

MLPClassifier Iterativni klasifikacijski algoritam koji uči uspoređivanjem rezultata klasifikacije sa stvarnom vrijednošću te rezultate vraća u mrežu i modificira algoritam za sljedeće iteracije.

Upotrebljava se za analizu teksta.

Nasumično odlučivanje Klasifikacija

Binarna klasifikacija

Višestruka klasifikacija

Brojčani

- Metoda zajedničkog učenja koja izrađuje više stabala odlučivanja i prikazuje vrijednost koja kolektivno predstavlja sva stabla odlučivanja.

Služi za predviđanje numeričkih i kategorijskih varijabli.

SVM Klasifikacija

Binarna klasifikacija

Višestruka klasifikacija

LinearSVC, SVC Klasificira zapise mapiranjem u prostor i konstruiranjem hiper-ravnina koje se mogu upotrebljavati za klasifikaciju. Novi zapisi (podaci o bodovanju) mapiraju se u prostor i predviđa se njihova pripadnost kategoriji, što se temelji na strani hiper-ravnine s koje se nalaze.

Obuka prediktivnog modela s pomoću mogućnosti AutoML u servisu Oracle Autonomous Data Warehouse

Kad upotrebljavate podatke iz servisa Oracle Autonomous Data Warehouse, možete upotrebljavati njegovu AutoML mogućnost kako biste preporučili i obučili prediktivni model. AutoML analizira vaše podatke, izračunava najbolji algoritam za upotrebu i registrira prediktivni model u Oracle Analytics kako biste mogli predviđati svoje podatke.

Upotreba mogućnosti AutoML znači da Oracle Autonomous Data Warehouse obavlja sav težak posao za vas kako biste vi mogli implementirati prediktivni model bez vještina strojnog učenja i umjetne inteligencije. Generirani prediktivni model sprema se u područje Modeli na stranici Strojno učenje. Za predviđanje podataka na temelju novog modela stvorite tijek podataka i upotrijebite korak Primijeni model.
Prije početka:
  • Stvorite skup podataka na temelju podataka u servisu Oracle Autonomous Data Warehouse za koji želite napraviti predviđanja. Na primjer, možete imati podatke o odlascima radnika, uključujući polje pod nazivom ATTRITION koje navodi 'Da' ili 'Ne' za odlazak.
  • Provjerite ima li korisnik baze podataka naveden u vezi servisa Oracle Analytics sa Oracle Autonomous Data Warehouse ulogu OML_Developer i je li on super korisnik 'administrator'. U suprotnome tijek podataka neće biti uspješan kad ga pokušate spremiti ili pokrenuti.
  1. Na početnoj stranici pritisnite Stvori, a zatim pritisnite Tijek podataka.
  2. U odjeljku Dodaj skup podataka odaberite skup podataka na temelju servisa Oracle Autonomous Data Warehouse koji sadrži podatke za analizu.
  3. Pritisnite Dodaj korak, a zatim pritisnite AutoML.
  4. Za Odredište pritisnite Odaberi stupac i odaberite stupac s podacima koji sadrži vrijednost koju pokušavate predvidjeti.
    Na primjer, za predviđanje odlazaka radnika možete odabrati polje pod nazivom ATTRITION koje navodi 'TRUE' ili 'FALSE' za to jesu li radnici napustili organizaciju.

  5. Prihvatite predloženu Vrstu zadatka i Metriku rangiranja modela koju predlaže Oracle Analytics ili odaberite drugi algoritam.
  6. Pritisnite Spremi model, i navedite naziv generiranog prediktivnog modela.
  7. Pritisnite Spremi i navedite naziv tijeka podataka.
  8. Pritisnite Pokreni za analizu podataka i generiranje prediktivnog modela.
  9. Na početnoj stranici pritisnite Navigacija, zatim pritisnite Strojno učenje te desnom tipkom miša pritisnite generirani model i odaberite Provjeri.
Možete pronaći model koji će Oracle Analytics generirati na stranici Strojno učenje u kartici Modeli. Provjerite model kako biste ocijenili njegovu kvalitetu. Pogledajte Ocjena kvalitete prediktivnog modela. Također se možete pozvati na povezane skupove podataka koji su generirani za modele koje generira AutoML. Pogledajte Koji su skupovi podataka povezani s prediktivnim modelom?.

Stvaranje i obuka za prognostički model

Napredni analitičari podataka stvaraju i obučavaju prediktivne modele kako bi ih mogli upotrebljavati za implementaciju Oracle algoritama za strojno učenje za pretraživanje skupova podataka, predviđanje odredišne vrijednosti ili identificiranje klasa zapisa. Upotrijebite uređivač tijeka podataka kako biste stvorili i obučili prognostičke modele i primijenili ih na svoje podatke.

Ikona vodiča LiveLabs Sprint

Postizanje točnog modela iterativni je proces, a napredni program za analizu podataka može isprobavati različite modele, uspoređivati njihove rezultate i prilagođavati parametre temeljem pokušaja i pogrešaka. Program za analizu podataka može upotrijebiti finalizirani, točan prognostički model za predviđanje trendova u drugim skupovima podataka ili dodati model radnim knjigama.

Bilješka:

Ako upotrebljavate podatke čiji je izvor Oracle Autonomous Data Warehouse, možete upotrebljavati AutoML mogućnost kako biste brzo i jednostavno pripremili prediktivni model za vas, bez potrebe za vještinama strojnog učenja. Pogledajte odjeljak Obuka prediktivnog modela s pomoću mogućnosti AutoML u servisu Autonomous Data Warehouse.

Oracle Analytics pruža algoritme za numeričko predviđanje, višestruku klasifikaciju, binarnu klasifikaciju i klasteriranje.

  1. Na početnoj stranici pritisnite Stvori, a zatim pritisnite Tijek podataka.
  2. Odaberite skup podataka pomoću kojega želite obučiti model. Pritisnite Dodaj.
  3. U uređivaču tijeka podataka pritisnite Dodaj korak (+).
    Nakon dodavanja skupa podataka možete upotrijebiti sve stupce iz skupa podataka za izradu modela ili pak odabrati samo relevantne stupce. Odabir relevantnih stupaca zahtijeva razumijevanje skupa podataka. Zanemarite one stupce za koje znate da neće utjecati na konačni ishod ili koji sadrže redundantne informacije. Dodavanjem koraka Odabir stupaca možete odabrati samo relevantne stupce. Ako niste sigurni u vezi relevantnih stupaca, odaberite sve stupce.
  4. Odaberite jedan od koraka modela obučavanja (npr., Obuka za numeričko predviđanje ili Obuka za klasteriranje).
  5. Odaberite algoritam i pritisnite U redu.
  6. Ako radite s nadziranim modelom kao što je predviđanje ili klasifikacija, pritisnite Cilj i odaberite stupac koji pokušavate predvidjeti. Npr., ako stvarate model za predviđanje osobnog prihoda, odaberite stupac Prihod.
    Ako radite s nenadziranim modelom kao što je klasteriranje, nije vam potreban ciljni stupac.
  7. Primijenite zadane postavke za svoj model kako biste prilagodili i unaprijedili točnost predviđenog prihoda. Te postavke određuje model s kojim radite.
  8. Pritisnite korak Spremi model i unesite naziv i opis.
  9. Pritisnite Spremi, unesite naziv i opis tijeka podataka i pritisnite U redu za spremanje tijeka podataka.
  10. Pritisnite Pokreni tijek podataka kako biste stvorili prognostički model na temelju skupa ulaznih podataka i odabranih postavki modela.

Koraci tijeka podataka za obučavanje modela za strojno učenje

Oracle Analytics omogućava vam obučavanje modela strojnog učenja s pomoću koraka u tijekovima podataka. Nakon obučavanja modela za strojno učenje, primijenite ga na svoje podatke s pomoću koraka Primijeni model.

Naziv koraka Opis
AutoML (zahtijeva Oracle Autonomous Data Warehouse) Upotrijebite AutoML mogućnost servisa Autonomous Data Warehouse kako biste preporučili i pripremili prediktivni model za vas. AutoML korak analizira vaše podatke, izračunava najbolji algoritam za upotrebu i registrira model predviđanja u Oracle Analytics.
Obuči binarni klasifikator

Obučite model strojnog učenja za klasificiranje podataka u jednu od dvije unaprijed definirane kategorije.

Obuči klasteriranje Obučite model strojnog učenja kako biste odvojili grupe sa sličnim osobinama i dodijelili ih u klastere.
Obuči višestruki klasifikator Obučite model strojnog učenja za klasificiranje podataka u tri ili više unaprijed definiranih kategorija.
Obuči numeričko predviđanje Obučite model strojnog učenja kako biste predvidjeli numeričku vrijednost na temelju poznatih vrijednosti podataka.

Provjera prediktivnog modela

Ako izradite prediktivni model i pokrenete tijek podataka, moći ćete pregledati informacije o modelu i utvrditi njegovu točnost. Pomoću tih informacija možete iterativno prilagoditi postavke modela i povećati točnost te bolje predvidjeti rezultate.

Prikaz pojedinosti prediktivnog modela

Pojedinosti prediktivnog modela omogućuju vam da bolje razumijete model i odredite je li prikladan za predviđanje podataka. Pojedinosti modela obuhvaćaju klasu modela, algoritam, ulazne i izlazne stupce

  1. Na početnoj stranici pritisnite Navigator, a zatim pritisnite Strojno učenje.
  2. Pritisnite ikonu izbornika za model za obuku i odaberite Pregledaj.
  3. Pritisnite Pojedinosti kako biste pregledali pojedinosti modela.

Ocjena kvalitete prediktivnog modela

Pregledajte informacije koje vam pomažu razumjeti kvalitetu prediktivnog modela. Na primjer, možete pregledati metrike točnosti kao što su točnost modela, preciznost, ponovno pozivanje, F1 vrijednost i broj lažno pozitivnih stavki.

Oracle Analytics donosi sličnu metriku, bez obzira na algoritam upotrijebljen za izradu modela, olakšavajući time usporedbu između različitih modela. Tijekom postupka izrade modela, skup ulaznih podataka razdvaja se u dva dijela, za obuku i testiranje modela na temelju parametra postotka particije za obuku. U modelu se upotrebljava testni dio skupa podataka za testiranje točnosti modela koji se izrađuje.
Na temelju vaših nalaza na kartici Kvaliteta možda ćete trebati prilagoditi parametre modela i ponovno ga obučiti.
  1. Na početnoj stranici pritisnite Navigator, a zatim pritisnite Strojno učenje.
  2. Pritisnite ikonu izbornika za model za obuku i odaberite Pregledaj.
  3. Pritisnite karticu Kvaliteta za pregled metrike kvalitete modela i njegovo ocjenjivanje. Npr., pregledajte rezultat Preciznosti modela.

Savjet: Pritisnite Više za pregled pojedinosti pregleda koji su generirani za model.

Koji su skupovi podataka povezani s prediktivnim modelom?

Kad pokrenete tijek podataka za izradu modela obuke prediktivnog modela servisa Oracle Analytics, Oracle Analytics izradit će skup srodnih skupova podataka. Kako biste saznali više o točnosti modela, možete otvarati i stvarati radne knjige u tim skupovima podataka.

Ovisno o algoritmu koji odaberete za model, srodni skupovi podataka sadrže pojedinosti o modelu, uključujući pravila predviđanja, metriku točnosti, matricu zamjene i ključne pokretače za predviđanje. Pomoću tih informacija prilagodite model za bolje rezultate; pomoću srodnih skupova podataka možete uspoređivati modele i odlučiti koji je model točniji.

Primjerice, možete otvoriti skup podataka pokretača kako biste otkrili koji stupci imaju snažan pozitivan ili negativan utjecaj na model. Pretraživanjem tih stupaca vidjet ćete kako neki stupci nisu obrađeni poput varijabli modela jer nisu realistični unosi ili su previše granularni za predviđanje. Pomoću uređivača tijeka podataka možete otvoriti model te na temelju otkrivenih informacija ukloniti stupce koji nisu relevantni ili su previše granulirani i ponovo generirati model. Na kartici Kvaliteta i rezultati provjerite je li unaprijeđena točnost modela. Nastavite s tim procesom dok ne budete zadovoljni s točnošću modela i njegovom spremnošću za bodovanje novog skupa podataka.

Različiti algoritmi generirali su slične srodne skupove podataka. Pojedinačni parametri i nazivi stupaca mogu se mijenjati u skupu podataka ovisno o vrsti algoritma, ali funkcionalnost skupa podataka ostaje ista. Npr., nazivi stupaca u statističkom skupu podataka mogu se promijeniti iz linearne u logističku regresiju, ali skup statističkih podataka sadrži metriku točnosti modela.

Povezani skupovi podataka za AutoML modele

Kada trenirate prediktivni model pomoću AutoML-a, Oracle Analytics stvara dodatne skupove podataka koji sadrže korisne informacije o modelu. Broj kreiranih skupova podataka ovisi o algoritmu modela. Na primjer, za Naive Bayes modele, Oracle Analytics stvara skup podataka koji pruža informacije o uvjetnim vjerojatnostima. Za model stabla odlučivanja skup podataka pruža informacije o statistici stabla odlučivanja. Kada provjeravate model koji je generirao AutoML pomoću algoritma generaliziranog linearnog modela (GLM), vidjet ćete unose s prefiksom GLM* za skupove podataka specifične za model koji sadrže metapodatke o modelu.
Slijedi opis za GUID-1A190D76-82D5-4BEC-82C4-D881CFECA14D-default.png
.png

Povezani skupovi podataka

Bilješka:

Oracle Analytics pridodat će izlazni naziv tijeka podataka povezanoj vrsti skupa podataka. Npr., za CART model, ako je izlaz tijeka podataka nazvan cart_model2, skup podataka bit će nazvan cart_model2_CART.

CART

Oracle Analytics stvorit će tablicu za CART skup podataka (stablo klasifikacije i regresije) koji sadrži stupce koji predstavljaju uvjete i kriterije uvjeta u stablu odlučivanja, predviđanje za svaku grupu i pouzdanost predviđanja. Upotrijebite vizualizaciju razgranatog dijagrama kako biste vizualizirali stablo odlučivanja.

CART skup podataka stvara se nakon odabira kombinacija modela i algoritama.

Model Algoritam
Numerički CART za numeričko predviđanje
Binarna klasifikacija CART
Višestruka klasifikacija CART

Izvješće o klasifikaciji

Oracle Analytics stvara tablicu za skup podataka povezan s izvješćem o klasifikaciji. Npr., ako ciljni stupac može imati dvije zasebne vrijednosti, Da ili Ne, taj skup podataka prikazuje metriku točnosti kao što je F1, Preciznost, Ponovni poziv i Podrška (broj redaka u skupu podataka za obuku s tom vrijednošću) za svaku zasebnu vrijednost ciljnog stupca.

Skup podataka o klasifikaciji stvara se nakon odabira kombinacija modela i algoritama.

Model Algoritmi
Binarna klasifikacija

Naive Bayes

Neuronska mreža

Podržano vektorsko računalo

Višestruka klasifikacija

Naive Bayes

Neuronska mreža

Podržano vektorsko računalo

Matrica zamjene

Oracle Analytics stvorit će zaokretnu tablicu za skup vezan uz matricu zamjene, koja je poznata i kao matrica pogrešaka. Svaki redak predstavlja instancu predviđene klase, a svaki stupac predstavlja instancu stvarne klase. U ovoj tablici prikazuje se broj lažno pozitivnih stavki, lažno negativnih stavki, ispravno prepoznatih pozitivnih stavki i ispravno prepoznatih negativnih stavki, pomoću kojih se izračunavaju preciznost, ponovno pozivanje i F1 metrika točnosti.

Skup podataka matrice zamjene stvorit će se nakon odabira kombinacija modela i algoritama.

Model Algoritmi
Binarna klasifikacija

Logistička regresija

CART (stablo odlučivanja)

Naive Bayes

Neuronska mreža

Nasumično odlučivanje

Podržano vektorsko računalo

Višestruka klasifikacija

CART (stablo odlučivanja)

Naive Bayes

Neuronska mreža

Nasumično odlučivanje

Podržano vektorsko računalo

Pokretači

Oracle Analytics stvorit će tablicu za skup podataka povezan s pokretačima koji sadrži informacije o stupcima koji određuju ciljne vrijednosti stupaca. Za identificiranje tih stupaca služe linearne regresije. Svakom se stupcu dodjeljuju vrijednosti koeficijenta i korelacije. Vrijednost koeficijenta opisuje omjer mase i starosti stupca te utvrđuje vrijednost ciljnog stupca. Vrijednost korelacije određuje smjer odnosa između ciljnog i ovisnog stupca. Npr., povećava li se vrijednost ciljnog stupca ili pak smanjuje na temelju ovisnog stupca.

Skup podataka o pokretačima stvara se nakon odabira kombinacija modela i algoritama.

Model Algoritmi
Numerički

Linearna regresija

Elastic Net linearna regresija

Binarna klasifikacija

Logistička regresija

Podržano vektorsko računalo

Višestruka klasifikacija Podržano vektorsko računalo

Karta lokacija

Oracle Analytics stvorit će tablicu za skup podataka povezan s kartom pogodaka koji sadrži informacije o čvorovima stabla odluka. Svaki redak u tablici predstavlja čvor i sadrži informacije koje opisuju što taj čvor predstavlja, npr. veličinu segmenta, pouzdanost i očekivani broj redaka. Primjerice, očekivani broj točnih predviđanja = veličina segmenta * pouzdanost.

Skup podataka karte lokacija stvorit će se nakon odabira kombinacija modela i algoritama.

Model Algoritam
Numerički CART za numeričko predviđanje

Rezidualne vrijednosti

Oracle Analytics stvorit će tablicu za skup podataka povezan s rezidualnim podacima koji sadrži informacije o kvaliteti rezidualnih predviđanja. Rezidualna vrijednost je razlika između izmjerene i predviđene vrijednosti u regresijskom modelu. Taj skup podataka sadrži zbirnu sumarnu vrijednost s apsolutnom razlikom između stvarnih i predviđenih vrijednosti za sve stupce iz skupa podataka.

Skup podataka rezidualnih vrijednosti stvara se nakon odabira kombinacija modela i algoritama.

Model Algoritmi
Numeričke vrijednosti

Linearna regresija

Elastic Net linearna regresija

CART za numeričko predviđanje

Binarna klasifikacija CART (stablo odlučivanja)
Višestruka klasifikacija CART (stablo odlučivanja)

Statistički podaci

Oracle Analytics stvara tablicu za skup podataka povezan sa statistikom. Metrika tog skupa podataka ovisi o algoritmu kojim je generirana. Napominjemo kako se taj popis metričkih vrijednosti temelji na algoritmu:

  • Linearna regresija, CART za numeričko predviđanje, Elastic Net linearna regresija – ti algoritmi sadrže srednju apsolutnu pogrešku R-kvadrata, prilagođenog R-kvadrata (MAE), glavnu kvadratnu pogrešku (MSE), relativnu apsolutnu pogrešku (RAE), odnosnu kvadratnu pogrešku (RSE), srednju korijensku kvadratnu pogrešku (RMSE).
  • CART (klasifikacijski i regresijski ogranci), Naive Bayes klasifikacija, Neuronska mreža, Podržano vektorsko računalo (SVM), Nasumično odlučivanje, Logistička regresija – Ti algoritmi sadrže točnost, ukupnu vrijednost za F1.

Taj skup podataka stvara se nakon odabira kombinacija modela i algoritama.

Model Algoritam
Numerički

Linearna regresija

Elastic Net linearna regresija

CART za numeričko predviđanje

Binarna klasifikacija

Logistička regresija

CART (stablo odlučivanja)

Naive Bayes

Neuronska mreža

Nasumično odlučivanje

Podržano vektorsko računalo

Višestruka klasifikacija

Naive Bayes

Neuronska mreža

Nasumično odlučivanje

Podržano vektorsko računalo

Sažetak

Oracle Analytics stvorit će tablicu za skup podataka povezan sa sažetkom koji sadrži informacije poput naziva odredišta i modela.

Skup podataka sažetka stvara se nakon odabira kombinacija modela i algoritama.

Model Algoritmi
Binarna klasifikacija

Naive Bayes

Neuronska mreža

Podržano vektorsko računalo

Višestruka klasifikacija

Naive Bayes

Neuronska mreža

Podržano vektorsko računalo

Traženje skupova podataka povezanih s prediktivnim modelom

Povezani skupovi podataka generiraju se kad obučavate prediktivni model.

Ovisno o algoritmu, povezani skupovi podataka sadrže pojedinosti o modelu, uključujući: pravila predviđanja, metriku točnosti, matricu zamjene, ključne pokretače za predviđanje itd. Ti vam parametri pomažu shvatiti pravila koja se u modelu upotrebljavaju za utvrđivanje predviđanja i klasifikacija.
  1. Na početnoj stranici pritisnite Navigator, a zatim pritisnite Strojno učenje.
  2. Pritisnite ikonu izbornika za model za obuku i odaberite Pregledaj.
  3. Pritisnite karticu Povezano kako biste pristupili povezanim skupovima podataka za model.
  4. Dvaput pritisnite povezani skup podataka kako biste ga pregledali ili upotrijebili u radnoj knjizi.

Dodavanje prognostičkog modela radnoj knjizi

Pri izradi scenarija u radnoj knjizi, primijenite prognostički model na skup podataka radne knjige kako biste otkrili trendove i uzorke za čiji je pronalazak model dizajniran.

Bilješka:

Oracle model za strojno učenje ne možete primijeniti na podatke radne knjige.
Nakon što radnoj knjizi dodate model i mapirate ulaze modela u stupce skupa podataka, na prozoru Podaci prikazat će se objekti modela koje možete povući i ispustiti na podlogu. Strojno učenje generira vrijednosti modela na temelju odgovarajućih stupaca podataka iz vizualizacije.
  1. Na početnoj stranici pritisnite Stvori, a zatim pritisnite Radna knjiga.
  2. Odaberite skup podataka koji želite upotrijebiti za stvaranje radne knjige i pritisnite Dodaj u radnu knjigu.
  3. U prozoru Podaci pritisnite Dodaj i odaberite Stvori scenarij.
  4. U dijaloškom okviru Stvaranje scenarija – odabir modela odaberite model i pritisnite U redu.
    Primijeniti možete samo prognostički model. Ne možete primijeniti Oracle model za strojno učenje.
    Ako se svi modeli ne mogu uskladiti s elementima podataka, prikazat će se dijaloški okvir Mapiranje podataka u model.
  5. Ako se prikaže dijaloški okvir Mapiranje podataka u model, u polju Skup podataka odaberite skup podataka za upotrebu s modelom.
  6. Prema potrebi uskladite ulaz modela i elemente podataka. Pritisnite Gotovo.
    Scenarij će se prikazati kao skup podataka u prozoru Elementi podataka.
  7. Povucite i ispustite elemente iz skupa podataka i modela na podlogu Vizualizacija.
  8. Za podešavanje scenarija, desnom tipkom miša pritisnite scenarij u prozoru Elementi podataka i odaberite Uredi scenarij.
  9. Prema potrebi promijenite skup podataka i ažurirajte mapiranje ulaza modela i elemenata podataka.
  10. Za spremanje radne knjige pritisnite Spremi.