Preparazione dei dati

Definire come valutare e gestire i dati prima di eseguire la previsione, ad esempio come gestire valori anomali o valori mancanti. Queste opzioni per la preparazione dei dati possono migliorare la qualità dei dati utilizzati per la previsione.

Definire la modalità di gestione dei dati per ciascun driver. Si noti che un valore Target impostato su indica la misura target da prevedere.

  1. Per i dati futuri del driver di input, selezionare Esegui previsione valori driver di input mancanti se si desidera prevedere valori in cui mancano i valori del driver di input.

    I valori mancanti vengono previsti utilizzando previsioni statistiche (previsioni univariate) e vengono utilizzati per l'addestramento del modello di apprendimento automatico.

  2. Per ogni driver, definire come gestire i valori mancanti: fare clic sull'icona Modifica Icona Modificanella colonna Azioni, quindi dall'elenco Valori mancanti selezionare un'opzione per gestire i valori mancanti per il driver.

    I dati possono includere valori mancanti per diversi motivi, ad esempio errori di misurazione, problemi di formattazione, errori umani o mancanza di informazioni. È possibile definire la modalità di riempimento di questi valori mancanti, in modo da aggiungere valori standardizzati alle voci mancanti nel set di dati.

    • Nessuno: non viene eseguita alcuna azione e i dati vengono inviati così come sono.
    • Zero: i valori mancanti vengono sostituiti per qualsiasi colonna con zero.
    • Sostituisci con media: viene eseguita la sostituzione con la media delle serie cronologiche.
    • Sostituisci con mediana: viene eseguita la sostituzione con il punto mediano della serie cronologica.
    • Sostituisci con modalità: viene eseguita la sostituzione con il valore più comune nei dati cronologici.
    • Sostituisci con valore osservato successivo: i valori mancanti vengono sostituiti con il valore osservato nel periodo successivo.
    • Sostituisci con ultimo valore osservato: i valori mancanti vengono sostituiti con il valore osservato nel periodo precedente.
  3. Per ciascun driver, nell'elenco Valori anomali selezionare un'opzione da utilizzare per gestire i valori anomali, ovvero tutti i valori che non rientrano nell'intervallo mean +/- 3*Standard Deviation per il driver.
    • Nessuno: non viene eseguita alcuna azione e i dati vengono inviati così come sono.

    • Sostituisci con zero: viene eseguita la sostituzione con zero.

    • Sostituisci con media: viene eseguita la sostituzione con la media.

    • Sostituisci con z_score: viene eseguita la sostituzione con z_score.

      Per qualsiasi colonna numerica, qualunque valore che non rientra in mean +/- 3*Standard Deviation (std dev) viene considerato un valore anomalo. Un valore inferiore a mean - 3*std dev viene sostituito con mean -3*std dev. Un valore superiore a mean - 3*std dev viene sostituito con mean + 3*std dev.

  4. Fare clic su Successivo.