Analizzare i dati con Explain

Explain utilizza Machine Learning per trovare utili approfondimenti sui dati.

Descrizione di Explain

Explain analizza la colonna selezionata nel contesto del rispettivo data set e genera descrizioni di testo relative agli approfondimenti trovati. Ad esempio, sarà possibile ottenere informazioni di base, driver chiave, segmenti che spiegano la colonna e anomalie per qualsiasi colonna.

Explain usa Oracle Machine Learning per generare informazioni accurate, veloci e potenti sui dati e crea le visualizzazioni corrispondenti che è possibile aggiungere allo sfondo della cartella di lavoro.

Explain è ideale per gli analisti dei dati che potrebbero non sapere quali sono le tendenze dei dati che stanno cercando e non desiderano dedicare tempo alla sperimentazione trascinando le colonne sullo sfondo oppure utilizzando i flussi di dati per creare e applicare i modelli predittivi.

Explain costituisce inoltre un utile punto di partenza per gli analisti dei dati che desiderano confermare una tendenza ricercata per i dati e successivamente utilizzare queste informazioni per creare e perfezionare modelli predittivi da applicare ad altri data set.

Descrizione degli approfondimenti

Per approfondimenti si intendono le categorie che descrivono la colonna selezionata nel contesto del relativo data set.

Icona Esercitazione Sprint LiveLabs

Gli approfondimenti restituiti da Explain si basano sul tipo di colonna o sull'aggregazione scelti e variano a seconda del set di regole di aggregazione per la metrica scelta. Explain genera solo gli approfondimenti pertinenti per il tipo di colonna scelto.

Tipo di approfondimento Descrizione
Informazioni di base Visualizza la distribuzione di base dei valori della colonna. I dati della colonna vengono suddivisi in base a ogni misura del data set.
Questo tipo di approfondimento è disponibile per tutti i tipi di colonna.
  • Per una metrica selezionata, questo approfondimento mostra la distribuzione del valore di metrica aggregato per ogni membro di ogni colonna di attributi.
  • Per un attributo selezionato, questo approfondimento mostra il valore di ogni metrica nel data set tra i valori membro dell'attributo.
Driver chiave Mostra le colonne del data set con il livello più elevato di correlazione con il risultato della colonna selezionata. I grafici visualizzano la distribuzione del valore selezionato in ogni valore di attributo correlato.

Questa scheda viene visualizzata solo quando si spiegano le colonne degli attributi o quando si spiega una colonna di metriche con una regola di aggregazione media.

Segmenti Visualizza i segmenti o i gruppi chiave dai valori della colonna. Explain esegue un algoritmo di classificazione sui dati per determinare le intersezioni dei valori dati e identifica gli intervalli di valori in tutte le dimensioni che generano la probabilità più alta per un determinato risultato dell'attributo.

Ad esempio, un gruppo di persone di un determinato intervallo di età, da un determinato set di posizioni, con un determinato intervallo di anni di formazione, costituisce un segmento che ha una probabilità molto alta di acquistare un determinato prodotto.

Questa scheda viene visualizzata solo quando si spiegano le colonne degli attributi.

Anomalie Identifica una serie di valori in cui uno dei valori (aggregati) si allontana in modo sostanziale da ciò che gli algoritmi di regressione prevedono.

Utilizzare Explain per trovare gli approfondimenti nei dati

Quando si seleziona una colonna e si sceglie la funzione Explain, Oracle Analytics utilizza Machine Learning per analizzare la colonna nel contesto del data set. Ad esempio, Explain cerca i driver chiave e le anomalie nei dati selezionati.

Explain visualizza i risultati di tale ricerca sotto forma di descrizioni di testo e visualizzazioni che è possibile aggiungere allo sfondo della cartella di lavoro.
Se si esegue Explain su una colonna e i risultati contengono troppe colonne correlate con classificazione elevata (ad esempio, CAP con città e stato), escludere alcune colonne dal data set in modo che Explain possa identificare driver più significativi. Vedere Nascondere o eliminare una colonna.

Explain è disponibile dopo l'installazione di Machine Learning nella directory Oracle Analytics Desktop locale. Vedere Come si esegue l'installazione di Machine Learning per Desktop?

  1. Nella Home page fare clic su Crea, quindi fare clic su Cartella di lavoro per creare una nuova cartella di lavoro.
  2. Fare clic su Visualizza per aprire la pagina Visualizza.
  3. In Pannello dati fare clic con il pulsante destro del mouse su una colonna e selezionare Spiegazione <elemento dati>.

    Affinché Explain possa analizzare un attributo in modo corretto, l'attributo deve disporre di un numero di valori distinti compreso tra 3 e 99.
    Nella finestra di dialogo Explain vengono visualizzate informazioni di base, anomalie e altre informazioni sulla colonna selezionata.
  4. Esaminare gli approfondimenti suggeriti in altre categorie facendo clic sulle schede. Ad esempio, Informazioni di base su <attributo> oppure Anomalie di <attributo>.
  5. Per ogni approfondimento che si desidera includere nello sfondo della cartella di lavoro, passarvi sopra con il puntatore del mouse e fare clic su Selezionare per lo sfondo.
    Accanto agli elementi selezionati verrà visualizzato un segno di spunta verde Segno di spunta verde.

    È possibile selezionare più approfondimenti da qualsiasi scheda.
  6. Fare clic su Aggiungi selezione per aggiungere gli approfondimenti contrassegnati con un segno di spunta verde su una qualsiasi delle schede.
    Gli approfondimenti Explain possono essere gestiti come qualsiasi altra visualizzazione creata manualmente nello sfondo.
Se si desidera ottimizzare gli approfondimenti, fare clic su Impostazioni per modificare le colonne analizzate e configurare le opzioni per tale categoria, ad esempio la selezione della dimensione minima per i segmenti.