Gegevens analyseren met Explain

Explain maakt gebruik van automatisch leren om nuttige insights over uw gegevens te vinden.

Wat is Explain?

Met Explain wordt de geselecteerde kolom geanalyseerd binnen de context van de bijbehorende gegevensset en worden tekstbeschrijvingen over de gevonden insights gegenereerd. U kunt bijvoorbeeld voor elke kolom de basisfeiten, belangrijke drivers, segmenten waarmee wordt verklaard en afwijkingen vinden.

Explain maakt gebruik van Oracle Machine Learning om nauwkeurige, snelle en krachtige informatie over uw gegevens te genereren. Met Explain worden bijbehorende visualisaties gemaakt die u aan het canvas van uw werkmap kunt toevoegen.

Explain is bedoeld voor gegevensanalisten die wellicht niet weten welke gegevenstrends ze zoeken, en geen tijd willen besteden aan experimenteren door kolommen naar het canvas te slepen of voorspellingsmodellen te trainen en toe te passen met behulp van gegevensstromen.

Explain vormt ook een handig beginpunt voor gegevensanalisten die een trend willen bevestigen die ze in hun gegevens zoeken, en deze informatie vervolgens willen gebruiken om voorspellingsmodellen te maken en af te stemmen zodat ze in andere gegevenssets kunnen worden toegepast.

Wat zijn insights?

Insights zijn categorieën die de geselecteerde kolom beschrijven binnen de context van de gegevensset.

Pictogram voor zelfstudie LiveLabs Sprint

De insights die in Explain worden geleverd, zijn gebaseerd op het gekozen kolomtype of de gekozen aggregatie, en verschillen afhankelijk van de aggregatieregelset voor de gekozen metric. In Explain worden alleen de insights gegenereerd die van toepassing zijn op het kolomtype dat u kiest.

Insighttype Beschrijving
Basisfeiten Hiermee wordt de basisdistributie van de waarden van de kolom weergegeven. Kolomgegevens worden uiteengezet aan de hand van elk van de eenheden van de gegevensset.
Deze insight is beschikbaar voor alle kolomtypen.
  • Deze insight geeft voor een geselecteerde metric de distributie van de geaggregeerde metricwaarde weer voor elk lid van elke attribuutkolom.
  • Deze insight geeft voor elk geselecteerd attribuut de waarde weer van elke metric in de gegevensset, voor de lidwaarden van het attribuut.
Belangrijke drivers Hiermee worden de kolommen in de gegevensset getoond die de grootste mate van correlatie hebben met het geselecteerde kolomresultaat. Voor elke gecorreleerde attribuutwaarde wordt de distributie van de geselecteerde waarde in een diagram weergegeven.

Dit tabblad wordt alleen weergegeven bij een uitleg over attribuutkolommen of bij een uitleg van een metrickolom die de aggregatieregel 'Gemiddelde' bevat.

Segmenten Hiermee worden de belangrijkste segmenten (of groepen) van de kolomwaarden weergegeven. In Explain wordt een classificatiealgoritme uitgevoerd voor de gegevens om de gegevenswaardesnijpunten vast te stellen en worden waardenreeksen geïdentificeerd in alle dimensies die de hoogste waarschijnlijkheid genereren voor een bepaald resultaat van het attribuut.

Bijvoorbeeld: een groep personen uit een bepaalde leeftijdscategorie, van een bepaalde reeks locaties, met een bepaald aantal jaren aan opleiding vormt een segment dat zeer waarschijnlijk een bepaald product zal kopen.

Dit tabblad wordt alleen weergegeven bij een uitleg over attribuutkolommen.

Anomalieën Hiermee wordt een reeks waarden aangegeven waarbij een van de (geaggregeerde) waarden substantieel afwijkt van de verwachting van het regressiealgoritme.

Explain gebruiken om gegevensinsights te ontdekken

Als u een kolom selecteert en de functie 'Explain' selecteert, wordt in Oracle Analytics gebruikgemaakt van automatisch leren om de kolom te analyseren in de context van de gegevensset. Met Explain wordt in de geselecteerde gegevens bijvoorbeeld gezocht naar belangrijke drivers en afwijkingen.

Explain toont de resultaten als tekstbeschrijvingen en visualisaties die u kunt toevoegen aan het canvas van uw werkmap.
Als u Explain uitvoert op een kolom en de resultaten te veel gecorreleerde en hoog gerangschikte kolommen bevatten (bijvoorbeeld postcode met plaats en staat), kunt u bepaalde kolommen uit de gegevensset verwijderen zodat er betekenisvollere drivers kunnen worden geïdentificeerd. Zie voor meer informatie: Kolommen verbergen of verwijderen.

Explain is beschikbaar als u Machine Learning hebt geïnstalleerd in uw lokale Oracle Analytics Desktop directory. Zie voor meer informatie: Hoe installeer ik Machine Learning voor Desktop?

  1. Klik op de beginpagina op Maken en klik vervolgens op Werkmap om een nieuwe werkmap te maken.
  2. Klik op Visualiseren om de pagina Visualiseren te openen.
  3. Klik in het gegevensvenster met de rechtermuisknop op een kolom en selecteer Explain <gegevenselement>.

    Voor een succesvolle analyse van een attribuut moet het attribuut 3 tot 99 verschillende waarden bevatten.
    In het dialoogvenster 'Explain' worden basisfeiten, afwijkingen en andere informatie over de geselecteerde kolom weergegeven.
  4. Bekijk de voorgestelde inzichten in andere categorieën door te klikken op de tabbladen. Bijvoorbeeld: basisfeiten over <attribute> of anomalieën van <attribute>.
  5. Wijs elk inzicht dat u in het canvas van uw werkmap wilt opnemen aan en klik op Selecteren voor canvas.
    Er staat een groen vinkje (Groen vinkje) naast de geselecteerde items.

    U kunt op elk van de tabbladen meerdere inzichten selecteren.
  6. Klik op Geselecteerde toevoegen om de zichten met een groen vinkje op elk van de tabbladen toe te voegen.
    U kunt de Explain-inzichten beheren zoals alle andere visualisaties die u handmatig hebt gemaakt voor het canvas.
Klik om de inzichten optimaal af te stemmen op Inzichten om de geanalyseerde kolommen te wijzigen en opties te configureren voor die categorie, zoals de minimale grootte van segmenten.