Oprette og bruge Oracle Analytics-forudsigelsesmodeller

Oracle Analytics-forudsigelsesmodeller bruger flere integrerede Oracle-algoritmer for maskinel indlæring til at minere dine datasæt, forudsige en målværdi eller identificere record-klasser. Brug datafloweditoren til at oprette, træne og anvende forudsigelsesmodeller på dine data.

Hvad er Oracle Analytics-forudsigelsesmodeller?

En Oracle Analytics-forudsigelsesmodel anvender en specifik algoritme på et datasæt for at forudsige værdier, forudsige klasser eller identificere grupper i dataene.

Du kan også bruge Oracle-modeller til maskinel indlæring til at forudsige data.

Oracle Analytics omfatter algoritmer, der kan hjælpe dig med at træne forudsigelsesmodeller til forskellige formål. Eksempler på algoritmer er klassificerings- og regressionstræer (CART), logistisk regression og K-Means.

Du bruger datafloweditoren til først at træne en model i et træningsdatasæt. Når forudsigelsesmodellen er trænet, anvender du den på de datasæt, som du vil forudsige.

Du kan gøre en trænet model tilgængelig for andre brugere, der kan anvende den på deres data for at forudsige værdier. I nogle tilfælde træner bestemte brugere modeller, og andre brugere anvender modellerne.

Bemærk:

Hvis du ikke er sikker på, hvad du skal kigge efter i dine data, kan du starte ved hjælp af Forklar, der bruger maskinel indlæring til at identificere tendenser og mønstre. Derefter kan du bruge datafloweditoren til at oprette og træne forudsigelsesmodeller for at bore ind i de tendenser og mønstre, som Forklar har fundet.
Du bruger datafloweditoren til at træne en model:
  • Først opretter du et dataflow og tilføjer det datasæt, som du vil bruge til at træne modellen. Dette træningsdatasæt indeholder de data, som du vil forudsige (for eksempel en værdi som salg eller alder eller en variabel som kreditrisikoperiode).
  • Du kan om nødvendigt bruge datafloweditoren til at redigere datasættet ved at tilføje kolonner, vælge kolonner, foretage sammenkædninger og så videre.
  • Når du har kontrolleret, at du vil bruge de pågældende data til at træne modellen med, skal du føje et træningstrin til dataflowet og vælge en klassificerings- (binær eller multi), regressions- eller klyngealgoritme for at træne modellen. Navngiv derefter modellen, gem dataflowet, og kør det for at træne og oprette modellen.
  • Kig nærmere på egenskaberne i objekterne til maskinel indlæring for at se, hvordan modellens kvalitet er. Du kan om nødvendigt gentage træningsprocessen, indtil modellen har den ønskede kvalitet.

Anvend den færdige model på ukendte data eller data uden etiket, så du kan generere et datasæt i et dataflow eller føje en forudsigelsesvisualisering til en projektmappe.

Eksempel

Lad os antage, at du vil oprette og træne en multiklassificeringsmodel for at forudsige, hvilke patienter der har høj risiko for at udvikle hjertesygdomme.

  1. Anvend et træningsdatasæt, der indeholder attributter om individuelle patienter, herunder alder, køn, eventuelle oplevede brystsmerter samt metrikker, herunder blodtryk, fastende blodsukker, kolesterol og maks. puls. Træningsdatasættet indeholder også kolonnen "Sandsynlighed", der har fået tildelt en af følgende værdier: fraværende, mindre sandsynligt, sandsynligt, meget sandsynligt eller forekommer.
  2. Vælg algoritmen CART (beslutningstræ), fordi den ignorerer overflødige kolonner, som ikke tilføjer nogen værdi for forudsigelsen og kun identificerer og bruger de kolonner, der hjælper med at forudsige målet. Når du føjer algoritmen til dataflowet, skal du vælge kolonnen Sandsynlighed for at træne modellen. Algoritmen bruger maskinel indlæring til at vælge de driverkolonner, som den skal bruge til at udføre og returnere forudsigelser og relaterede datasæt.
  3. Inspicer resultaterne, og finjuster træningsmodellen, og anvend derefter modellen på et større datasæt for at forudsige, hvilke patienter der har en høj sandsynlighed for at have eller udvikle hjertesygdomme.

Hvordan vælger jeg en forudsigelsesmodelalgoritme?

Oracle Analytics omfatter algoritmer til alle dine behov, hvad angår modeller til maskinel indlæring: numerisk forudsigelse, multiklassificering, binær klassificering og klynger.

Oracles funktionalitet til maskinel indlæring er beregnet til erfarne analytikere, som ved, hvad de kigger efter i dataene, er bekendt med, hvordan de skal udføre forudsigelsesanalyser, og forstår forskellen mellem algoritmer.

Bemærk:

Hvis du bruger data, der stammer fra Oracle Autonomous Data Warehouse, kan du bruge AutoML-egenskaben til hurtigt og nemt at træne en prædiktiv model, uden at du behøver at have kendskab til maskinel indlæring. Se Træne en forudsigelsesmodel ved hjælp af AutoML i Autonomous Data Warehouse.

Normalt opretter brugere flere forudsigelsesmodeller, sammenligner dem og vælger den, der har størst sandsynlighed for at returnere resultater, som opfylder deres kriterier og krav. Disse kriterier kan variere. Nogle gange vælger brugere for eksempel modeller med en bedre overordnet nøjagtighed, nogle gange vælger de modeller med de færreste type I-fejl (falsk positiv) og type II-fejl (falsk negativ), og nogle gange vælger de modeller, som returnerer resultater hurtigere og med et acceptabelt nøjagtighedsniveau, selvom resultaterne ikke er ideelle.

Oracle Analytics indeholder flere algoritmer til maskinel indlæring for hver type forudsigelse eller klassificering. Med disse algoritmer kan brugerne oprette mere end én model, bruge forskellige finindstillede parametre eller bruge forskellige træningsdatasæt som input og derefter vælge den bedste model. Brugerne kan vælge den bedste model ved at sammenligne og veje modellerne op mod deres egne kriterier. For at finde frem til den bedste model kan brugerne anvende modellen og visualisere resultaterne af beregningerne for at vurdere nøjagtigheden, eller de kan åbne og udforske de relaterede datasæt, som Oracle Analytics brugte modellen til at returnere.

Se denne tabel for at få mere at vide om de angivne algoritmer:

Navn Type Kategori Funktion Beskrivelse
CART

Klassificering

Regression

Binær klassificering

Multiklassificering

Numerisk

- Bruger beslutningstræer til at forudsige både diskrete og kontinuerte værdier.

Brug sammen med store datasæt.

Lineær regression af typen Elastisk net Regression Numerisk ElasticNet Avanceret regressionsmodel. Angiver yderligere oplysninger (regularisering) og udfører variabelvalg og lineære kombinationer. Straffe for regressionsmetoderne Lasso og Ridge.

Brug sammen med et stort antal attributter for at undgå kollinearitet (hvor flere attributter er perfekt korreleret) og overfitting.

Hierarkisk Klynger Klynger AgglomerativeClustering Bygger et klyngehierarki ved hjælp af enten nedefra-og-op- (hver observation er i sin egen klynge og flettes derefter) eller oppefra-og-ned-metrikker (alle observationer starter som én klynge) og afstandsmetrikker.

Brug, når datasættet ikke er stort, og antallet af klynger ikke kendes på forhånd.

K-Means Klynger Klynger k-means Opdeler records i k-klynger gentagne gange, hvor hver enkelt observation tilhører klyngen med den nærmeste middelværdi.

Brug til klyngeopdeling af metrikkolonner og sammen med en angivet forventning om det nødvendige antal klynger. Fungerer godt sammen med store datasæt. Resultat er forskelligt for hver kørsel.

Lineær regression Regression Numerisk Ordinary Least Squares

Ridge

Lasso

Lineær tilgang til en modelleringsrelation mellem målvariablen og andre attributter i datasættet.

Bruges til at forudsige numeriske værdier, når attributterne ikke er perfekt korrelerede.

Logistisk regression Regression Binær klassificering LogisticRegressionCV Brug til at forudsige værdien af en kategorisk afhængig variabel. Den afhængige variabel er en binær variabel, der indeholder data, som er kodet til 1 eller 0.
Naive Bayes Klassificering

Binær klassificering

Multiklassificering

GaussianNB Probabilistisk klassificering, der er baseret på Bayes' sætning, som antager, at der ikke er nogen afhængighed mellem hændelser.

Brug, når der er et stort antal inputdimensioner.

Neural Network Klassificering

Binær klassificering

Multiklassificering

MLPClassifier Iterativ klassificeringsalgoritme, der lærer ved at sammenligne sit klassificeringsresultat med den faktiske værdi og returnerer det til netværket for at modificere algoritmen med henblik på yderligere gentagelser.

Brug til tekstanalyse.

Random Forest Klassificering

Binær klassificering

Multiklassificering

Numerisk

- En ensemble-læringsmetode, der konstruerer flere beslutningstræer og returnerer den værdi, som kollektivt repræsenterer alle beslutningstræerne.

Brug til at forudsige numeriske og kategoriske variabler.

SVM Klassificering

Binær klassificering

Multiklassificering

LinearSVC, SVC Klassificerer records ved at mappe dem i rum og konstruere hyperplaner, der kan bruges til klassificering. Nye poster (scoringsdata) mappes til rummet, og det forudsiges, at de tilhører en kategori, som er baseret på siden af den hyperplan, hvor de falder.

Træne en forudsigelsesmodel ved hjælp af AutoML i Oracle Autonomous Data Warehouse

Når du bruger data fra Oracle Autonomous Data Warehouse, kan du bruge dets AutoML-funktion til at anbefale og træne en forudsigelsesmodel. AutoML analyserer dine data, beregner den bedste algoritme til brug og registrerer en forudsigelsesmodel i Oracle Analytics, så du kan foretage forudsigelser af dine data.

Når du bruger AutoML, udfører Oracle Autonomous Data Warehouse alt det hårde arbejde for dig, så du kan tage en forudsigelsesmodel i brug uden kendskab til maskinel indlæring eller kunstig intelligens. Den genererede forudsigelsesmodel gemmes i området Modeller på siden Maskinel indlæring. Når du skal forudsige data på basis af den nye model, skal du oprette et dataflow og bruge trinnet Anvend model.
Før du går i gang:
  • Opret et datasæt på basis af de data i Oracle Autonomous Data Warehouse, som du vil oprette forudsigelser om. Du kan for eksempel have data om medarbejderafgang, herunder et felt med navnet ATTRITION, der angiver 'Ja' eller 'Nej' for afgang.
  • Sørg for, at den databasebruger, der er angivet i Oracle Analytics-forbindelsen til Oracle Autonomous Data Warehouse, har rollen OML_Developer og ikke er 'admin'-superbruger. Ellers fejler dataflowet, når du forsøger at gemme eller køre det.
  1. Klik på OpretStartside, og klik derefter på Dataflow.
  2. I Tilføj datasæt skal du vælge datasættet på basis af Oracle Autonomous Data Warehouse, der indeholder de data, som skal analyseres.
  3. Klik på Tilføj et trin, og klik derefter på AutoML.
  4. Klik på Vælg en kolonne for Mål, og vælg den datakolonne, der indeholder den værdi, som du forsøger at forudsige.
    Hvis du for eksempel skal forudsige medarbejderafgang, kan du vælge et felt med navnet ATTRITION, der angiver 'TRUE' eller 'FALSE' for, om medarbejdere har forladt en organisation eller ej.

  5. Accepter den foreslåede Opgavetype og Metrik for modelprioritering, som Oracle Analytics anbefaler, eller vælg en anden algoritme.
  6. Klik på Gem model, og angiv navnet på den genererede forudsigelsesmodel.
  7. Klik på Gem, og angiv et navn til dataflowet.
  8. Klik på Kør for at analysere dataene og generere en forudsigelsesmodel.
  9. Klik på Naviger på startsiden, klik derefter på Maskinel indlæring, højreklik på den genererede model, og vælg Inspicer.
Du kan finde den model, som Oracle Analytics genererer, på siden Maskinel indlæring på fanen Modeller. Inspicer modellen for at vurdere dens kvalitet. Se Vurdere en forudsigelsesmodels kvalitet. Du kan også se relaterede datasæt, der er genereret for modeller, som er generet af AutoML. Se Hvad er en forudsigelsesmodels relaterede datasæt?.

Oprette og træne en forudsigelsesmodel

Analytikere af avancerede data opretter og træner forudsigelsesmodeller, så de kan bruge dem til at tage Oracle Machine Learning-algoritmer i brug for at udføre mining af datasæt, forudsige en målværdi eller identificere klasser af records. Brug datafloweditoren til at oprette og træne forudsigelsesmodeller og anvende dem på dine data.

Ikonet Selvstudium LiveLabs Sprint

Det er en iterativ proces at finde frem til en nøjagtig model, hvor dataanalytikeren bruger "trial and error"-metoden og afprøver forskellige modeller, sammenligner resultater og finindstiller parametre. En dataanalytiker kan bruge den færdige, nøjagtige forudsigelsesmodel til at forudsige tendenser i andre datasæt eller føje modellen til projektmapper.

Bemærk:

Hvis du bruger data, der stammer fra Oracle Autonomous Data Warehouse, kan du bruge AutoML-egenskaben til hurtigt og nemt at træne en prædiktiv model, uden at du behøver at have kendskab til maskinel indlæring. Se Træne en forudsigelsesmodel ved hjælp af AutoML i Autonomous Data Warehouse.

Oracle Analytics omfatter algoritmer til numerisk forudsigelse, multiklassificering, binær klassificering og klynger.

  1. Klik på OpretStartside, og vælg derefter Dataflow.
  2. Vælg det datasæt, som du vil bruge til at træne modellen med. Klik på Tilføj.
  3. Klik på Tilføj et trin (+) i datafloweditoren.
    Når du har tilføjet et datasæt, kan du enten vælge at bygge modellen med alle kolonnerne i datasættet eller blot vælge de relevante kolonner. Brug af de relevante kolonner kræver en forståelse af datasættet. Ignorer kolonner, som ikke påvirker resultatets funktionsmåde, eller som indeholder overflødige oplysninger. Du kan nøjes med at vælge relevante kolonner ved at tilføje trinnet Vælg kolonner. Hvis du ikke er sikker på, hvilke kolonner der er relevante, kan du bruge alle kolonner.
  4. Vælg et af trinnene i træningsmodellen (for eksempel Træn numerisk forudsigelse eller Træn klynger).
  5. Vælg en algoritme, og klik på OK.
  6. Hvis du arbejder med en overvåget model som forudsigelse eller klassificering, skal du klikke på Mål og vælge den kolonne, som du forsøger at forudsige. Hvis du for eksempel opretter en model til forudsigelse af en persons indtægt, skal du vælge kolonnen Indtægt.
    Hvis du arbejder med en ikke-overvåget model som klynger, kræves der ikke nogen målkolonne.
  7. Ændr standardindstillingerne for din model for at finindstille og forbedre det forudsagte resultats nøjagtighed. Den model, som du arbejder med, bestemmer disse indstillinger.
  8. Klik på trinnet Gem model, og indtast et navn og en beskrivelse.
  9. Klik på Gem, indtast et navn og en beskrivelse af dataflowet, og klik på OK for at gemme dataflowet.
  10. Klik på Kør dataflow for at oprette forudsigelsesmodellen på grundlag af inputdatasættet og de modelindstillinger, som du har angivet.

Dataflowtrin til træning af modeller til maskinel indlæring

Med Oracle Analytics kan du træne modeller til maskinel indlæring ved hjælp af trin i dataflows. Når du har trænet en model til maskinel indlæring, kan du anvende den på dine data ved hjælp af trinnet Anvend model.

Trinnavn Beskrivelse
AutoML (kræver Oracle Autonomous Data Warehouse) Brug AutoML-egenskaben i Oracle Autonomous Data Warehouse til at anbefale og træne en prædiktiv model. AutoML-trinnet analyserer dine data, beregner den bedste algoritme til brug og registrerer en forudsigelsesmodel i Oracle Analytics.
Træn binær klassificering

Træne en model til maskinel indlæring til at klassificere dine data i en af de to foruddefinerede kategorier.

Træn klynger Træne en model til maskinel indlæring til at udskille grupper med lignende egenskaber og tildele dem i klynger.
Træn multiklassificering Træne en model til maskinel indlæring til at klassificere data i tre eller flere foruddefinerede kategorier.
Træn numerisk forudsigelse Træne en model til maskinel indlæring til at forudsige en numerisk værdi på basis af kendte dataværdier.

Inspicere en forudsigelsesmodel

Når du har oprettet forudsigelsesmodellen og kørt dataflowet, kan du gennemse oplysninger om modellen for at vurdere, hvor nøjagtig den er. Brug disse oplysninger til gentagne gange at regulere modelindstillingerne for at forbedre nøjagtigheden og forudsige bedre resultater.

Se en forudsigelsesmodels detaljer

En forudsigelsesmodels detaljerede oplysninger hjælper dig med at forstå modellen og bestemme, om den er egnet til forudsigelse af dine data. Modellens detaljer indeholder dens klasse, algoritme, inputkolonner og outputkolonner

  1. Klik på NavigatorStartside, og klik derefter på Maskinel indlæring.
  2. Klik på en træningsmodels menuikon, og vælg Inspicer.
  3. Klik på Detaljer for at se modellens oplysninger.

Vurdere en forudsigelsesmodels kvalitet

Se oplysninger, der hjælper dig med at forstå kvaliteten af en forudsigelsesmodel. Du kan for eksempel gennemgå nøjagtighedsmetrikker som modelnøjagtighed, præcision, tilbagekaldelse, F1-værdi og antal falske positiver.

Oracle Analytics leverer lignende metrikker, uanset hvilken algoritme der bruges til at oprette modellen, hvilket gør det nemt at sammenligne de forskellige modeller. Under modeloprettelsesprocessen opdeles inputdatasættet i to dele, så modellen kan trænes og testes, på grundlag af parameteren Procent for træning af partition. Modellen bruger testdelen af datasættet til at teste nøjagtigheden af den model, der er bygget.
På basis af det, som du ser på fanen Kvalitet, skal du måske regulere modellens parametre og træne den igen.
  1. Klik på NavigatorStartside, og klik derefter på Maskinel indlæring.
  2. Klik på en træningsmodels menuikon, og vælg Inspicer.
  3. Klik på fanen Kvalitet for at gennemgå modellens kvalitetsmetrikker, og vurder modellen. Gennemgå f.eks. scoren for Modelnøjagtighed.

Tip: Klik på Flere for at gennemgå detaljer for de visninger, der genereres for modellen.

Hvad er en forudsigelsesmodels relaterede datasæt?

Når du kører dataflowet for at oprette træningsmodellen til Oracle Analytics-forudsigelsesmodellen, opretter Oracle Analytics et sæt relaterede datasæt. Du kan åbne og oprette projektmapper på disse datasæt for at få mere at vide om modellens nøjagtighed.

Afhængigt af den algoritme, som du vælger til modellen, findes der relaterede datasæt, som indeholder detaljer om modellen, herunder forudsigelsesregler, nøjagtighedsmetrikker, forvirringsmatrix og nøgleparametre for forudsigelse. Du kan bruge disse oplysninger til at finindstille modellen, så du opnår bedre resultater, og du kan bruge relaterede datasæt til at sammenligne modeller og se, hvilken model der er mest nøjagtig.

Du kan for eksempel åbne datasættet Drivere for at se, hvilke kolonner der har den stærkeste positive eller negative effekt på modellen. Når du kigger nærmere på de pågældende kolonner, kan du se, at nogle kolonner ikke behandles som modelvariabler, fordi de ikke er realistisk input, eller at de er for specifikke til prognosen. Du bruger datafloweditoren til at åbne modellen, og på grundlag af de oplysninger, du fik ved at kigge på kolonnerne, fjerner du de irrelevante kolonner eller de kolonner, der er for specifikke, og genererer modellen igen. Du kan derefter gå til fanen Kvalitet og resultater og kontrollere, om modellens nøjagtighed er forbedret. Du fortsætter denne proces, indtil du er tilfreds med modellens nøjagtighed, og den er klar til at blive anvendt på et nyt datasæt.

Forskellige algoritmer genererer lignende relaterede datasæt. Afhængigt af algoritmetypen kan individuelle parametre og kolonnenavne ændres i datasættet, men datasættets funktionalitet forbliver uændret. Kolonnenavnene i et statistikdatasæt kan for eksempel ændres fra Lineær regression til Logistisk regression, men statistikdatasæt indeholder nøjagtighedsmetrikker for modellen.

Relaterede datasæt for AutoML-modeller

Når du træner en forudsigelsesmodel ved hjælp af AutoML, opretter Oracle Analytics yderligere datasæt, der indeholder nyttige oplysninger om modellen. Antallet af oprettede datasæt afhænger af modelalgoritmen. For Naive Bayes-modeller opretter Oracle Analytics for eksempel et datasæt med oplysninger om betingede sandsynligheder. For en beslutningstræmodel angiver datasættet oplysninger om statistik for beslutningstræ. Hvis du inspicerer en AutoML-genereret model ved hjælp af GLM-algoritmen (Generalized Linear Model), ser du poster med præfikset GLM* for de modelspecifikke datasæt, der indeholder metadataoplysninger om modellen.
Beskrivelse af GUID-1A190D76-82D5-4BEC-82C4-D881CFECA14D-default.png følger
.png

Relaterede datasæt

Bemærk:

Oracle Analytics føjer dataflowets outputnavn til datasættypen. Hvis dataflowets output for en CART-model for eksempel har navnet cart_model2, får datasættet navnet cart_model2_CART.

CART

Oracle Analytics opretter en tabel til det relaterede CART-datasæt (Classification and Regression Tree), som indeholder kolonner, der repræsenterer betingelserne og betingelsernes kriterier i beslutningstræet, en forudsigelse for hver gruppe og forudsigelsestillid. Brug trædiagramvisualiseringen til at visualisere dette beslutningstræ.

CART-datasættet oprettes, når du vælger disse kombinationer af model og algoritme.

Model Algoritme
Numerisk CART til numerisk forudsigelse
Binær klassificering CART
Multiklassificering CART

Klassificeringsrapport

Oracle Analytics opretter en tabel til det relaterede Klassificeringsrapport-datasæt. Hvis målkolonnen for eksempel kan have de to distinkte værdier Ja eller Nej, viser dette datasæt nøjagtighedsmetrikker som F1, præcision, genkaldelse og understøttelse (antallet af rækker i træningsdatasættet med denne værdi) for hver distinkte værdi i målkolonnen.

Klassificeringsdatasættet oprettes, når du vælger disse kombinationer af model og algoritme.

Model Algoritmer
Binær klassificering

Naive Bayes

Neural Network

Support Vector Machine

Multiklassificering

Naive Bayes

Neural Network

Support Vector Machine

Forvirringsmatrix

Oracle Analytics opretter en pivottabel for det relaterede Forvirringsmatrix-datasæt, som også kaldes en fejlmatrix. Hver række repræsenterer en instans af en forudsagt klasse, og hver kolonne repræsenterer en instans i en faktisk klasse. Denne tabel rapporterer antallet af falske positiver, falske negativer, ægte positiver og ægte negativer, som bruges til at beregne nøjagtighedsmetrikker for præcision, tilbagekaldelse og F1.

Forvirringsmatrix-datasættet oprettes, når du vælger disse kombinationer af model og algoritme.

Model Algoritmer
Binær klassificering

Logistisk regression

CART (beslutningstræ)

Naive Bayes

Neural Network

Random Forest

Support Vector Machine

Multiklassificering

CART (beslutningstræ)

Naive Bayes

Neural Network

Random Forest

Support Vector Machine

Drivere

Oracle Analytics opretter en tabel til det relaterede Drivere-datasæt, som indeholder oplysninger om de kolonner, der bestemmer målkolonneværdierne. Der bruges lineære regressioner til at identificere disse kolonner. Hver kolonne har fået tildelt koefficient- og korrelationsværdier. Koefficientværdien beskriver kolonnens vægtning, der bruges til at bestemme målkolonnens værdi. Korrelationsværdien angiver relationsretningen mellem målkolonnen og den afhængige kolonne. For eksempel om målkolonnens værdi øges eller mindskes på grundlag af den afhængige kolonne.

Drivere-datasættet oprettes, når du vælger disse kombinationer af model og algoritme.

Model Algoritmer
Numerisk

Lineær regression

Lineær regression af typen Elastisk net

Binær klassificering

Logistisk regression

Support Vector Machine

Multiklassificering Support Vector Machine

Hitmap

Oracle Analytics opretter en tabel til det relaterede Hitmap-datasæt, som indeholder oplysninger om beslutningstræets bladnoder. Hver række i tabellen repræsenterer en bladnode og indeholder oplysninger, der beskriver, hvad den pågældende bladnode repræsenterer, for eksempel segmentstørrelse, tillid og forventet antal rækker. For eksempel er forventet antal korrekte forudsigelser = Segmentstørrelse * Tillid.

Hitmap-datasættet oprettes, når du vælger disse kombinationer af model og algoritme.

Model Algoritme
Numerisk CART til numerisk forudsigelse

Restværdier

Oracle Analytics opretter en tabel til det relaterede Restværdier-datasæt, som indeholder oplysninger om kvaliteten af restværdiforudsigelserne. En restværdi er forskellen mellem den målte værdi og den forudsagte værdi i en regressionsmodel. Dette datasæt indeholder en aggregeret sumværdi af den absolutte forskel mellem de faktiske og de forudsagte værdier for alle kolonner i datasættet.

Restværdier-datasættet oprettes, når du vælger disse kombinationer af model og algoritme.

Model Algoritmer
Numerisk

Lineær regression

Lineær regression af typen Elastisk net

CART til numerisk forudsigelse

Binær klassificering CART (beslutningstræ)
Multiklassificering CART (beslutningstræ)

Statistik

Oracle Analytics opretter en tabel til det relaterede Statistik-datasæt. Dette datasæts metrikker afhænger af den algoritme, der blev brugt til at genere det. Se denne liste over metrikker, der er baseret på algoritme:

  • Lineær regression, CART til numerisk forudsigelse, Lineær regression af typen Elastisk net - disse algoritmer indeholder R-Square, R-Square Adjusted, Mean Absolute Error (MAE), Mean Squared Error (MSE), Relative Absolute Error (RAE), Related Squared Error (RSE) og Root Mean Squared Error (RMSE).
  • CART(klassificerings- og regressionstræer), Naive Bayes-klassificering, Neural Network, Support Vector Machine (SVM), Random Forest, Logistisk regression - disse algoritmer indeholder Nøjagtighed og Total F1.

Dette datasæt oprettes, når du vælger disse kombinationer af model og algoritme.

Model Algoritme
Numerisk

Lineær regression

Lineær regression af typen Elastisk net

CART til numerisk forudsigelse

Binær klassificering

Logistisk regression

CART (beslutningstræ)

Naive Bayes

Neural Network

Random Forest

Support Vector Machine

Multiklassificering

Naive Bayes

Neural Network

Random Forest

Support Vector Machine

Oversigt

Oracle Analytics opretter en tabel til det relaterede Oversigt-datasæt, som indeholder oplysninger som målnavn og modelnavn.

Oversigt-datasættet oprettes, når du vælger disse kombinationer af model og algoritme.

Model Algoritmer
Binær klassificering

Naive Bayes

Neural Network

Support Vector Machine

Multiklassificering

Naive Bayes

Neural Network

Support Vector Machine

Finde en forudsigelsesmodels relaterede datasæt

Når du træner en forudsigelsesmodel, genereres der relaterede datasæt.

Afhængigt af algoritmen indeholder relaterede datasæt detaljer om modellen, herunder: forudsigelsesregler, nøjagtighedsmetrikker, forvirringsmatrix, nøgleparametre for forudsigelse og så videre. Disse parametre hjælper dig med at forstå de regler, som modellen bruger til at bestemme forudsigelserne og klassificeringerne.
  1. Klik på NavigatorStartside, og klik derefter på Maskinel indlæring.
  2. Klik på en træningsmodels menuikon, og vælg Inspicer.
  3. Klik på fanen Relateret for at få adgang til modellens relaterede datasæt.
  4. Dobbeltklik på et relateret datasæt for at se det eller bruge det i en projektmappe.

Føje en forudsigelsesmodel til en projektmappe

Hvis du opretter et scenarie i en projektmappe, anvender du en forudsigelsesmodel på projektmappens datasæt for at vise de tendenser og mønstre, som modellen var designet til at finde.

Bemærk:

Du kan ikke anvende en Oracle-model til maskinel indlæring på en projektmappes data.
Når du har føjet modellen til projektmappen og mappet modellens input til datasættets kolonner, indeholder Datapanel modellens objekter, som du kan trække og slippe i kanvasset. Maskinel indlæring genererer modellens værdier på grundlag af de tilsvarende datakolonner i visualiseringen.
  1. Klik på Opret på siden Startside, og klik derefter på Projektmappe.
  2. Vælg det datasæt, som du vil bruge til oprettelse af projektmappen, og klik på Tilføj til projektmappe.
  3. Klik på Tilføj i ruden Data, og vælg Opret scenarie.
  4. Vælg en model i dialogboksen Opret scenarie - Vælg model, og klik på OK.
    Du kan kun anvende en forudsigelsesmodel. Du kan ikke anvende en Oracle-model til maskinel indlæring.
    Hvis et modelinput ikke kan matches med et dataelement, vises dialogboksen Map dine data til modellen.
  5. Hvis dialogboksen Map dine data til modellen vises, skal du vælge det datasæt, der skal bruges sammen med modellen, i feltet Datasæt.
  6. Match modelinputtet og dataelementerne efter behov. Klik på Udført.
    Scenariet vises som et datasæt i ruden Dataelementer.
  7. Træk og slip elementer fra datasættet og modellen i kanvasset Visualiser.
  8. Hvis du vil regulere scenariet, skal du højreklikke på scenariet i ruden Dataelementer og vælge Rediger scenarie.
  9. Ændr datasættet, og opdater modelinputtet og mappingen af dataelementer efter behov.
  10. Klik på Gem for at gemme projektmappen.