Definire come valutare e gestire i dati prima di eseguire la previsione, ad esempio come gestire valori anomali o valori mancanti. Queste opzioni per la preparazione dei dati possono migliorare la qualità dei dati utilizzati per la previsione.
Definire la modalità di gestione dei dati per ciascun driver. Si noti che un valore Target impostato su Sì indica la misura target da prevedere.
I valori mancanti vengono previsti utilizzando previsioni statistiche (previsioni univariate) e vengono utilizzati per l'addestramento del modello di apprendimento automatico.
I dati possono includere valori mancanti per diversi motivi, ad esempio errori di misurazione, problemi di formattazione, errori umani o mancanza di informazioni. È possibile definire la modalità di riempimento di questi valori mancanti, in modo da aggiungere valori standardizzati alle voci mancanti nel set di dati.
mean +/- 3*Standard Deviation per il driver.
Nessuno: non viene eseguita alcuna azione e i dati vengono inviati così come sono.
Sostituisci con zero: viene eseguita la sostituzione con zero.
Sostituisci con media: viene eseguita la sostituzione con la media.
Sostituisci con z_score: viene eseguita la sostituzione con z_score.
Per qualsiasi colonna numerica, qualunque valore che non rientra in mean +/- 3*Standard Deviation (std dev) viene considerato un valore anomalo. Un valore inferiore a mean - 3*std dev viene sostituito con mean -3*std dev. Un valore superiore a mean - 3*std dev viene sostituito con mean + 3*std dev.