Defina cómo evaluar y gestionar los datos antes de realizar la predicción, por ejemplo, cómo se van a gestionar los valores atípicos o los valores que faltan. Estas opciones para preparar los datos pueden mejorar la calidad de los datos utilizados para la predicción.
Defina cómo se van a gestionar los datos de cada inductor. Tenga en cuenta que un valor de Destino de Sí indica la medida de destino que se va a predecir.
Los valores que faltan se predicen mediante la previsión estadística (predicciones univariadas) y se utilizan para el entrenamiento del modelo de ML.
Los datos pueden contener valores que faltan por varios motivos, como fallos de medición, problemas de formato, errores humanos o falta de información. Puede definir cómo completar estos valores que faltan, lo que agrega valores estandarizados a las entradas que faltan en el conjunto de datos.
mean +/- 3*Standard Deviation para el inductor:
Ninguno: no realizar ninguna acción y enviar los datos tal cual.
Reemplazar por cero: reemplazar por cero.
Reemplazar por media: reemplazar por la media.
Reemplazar por z_score: reemplazar por z_score.
Para cualquier columna numérica, cualquier valor que se encuentre fuera de mean +/- 3*Standard Deviation (desviación estándar) se trata como un valor atípico. Un valor menor que mean - 3*std dev se reemplaza por mean -3*std dev. Un valor mayor que mean + 3*std dev se reemplaza por mean + 3*std dev.