Preparación de los datos

Defina cómo evaluar y gestionar los datos antes de realizar la predicción, por ejemplo, cómo se van a gestionar los valores atípicos o los valores que faltan. Estas opciones para preparar los datos pueden mejorar la calidad de los datos utilizados para la predicción.

Defina cómo se van a gestionar los datos de cada inductor. Tenga en cuenta que un valor de Destino de indica la medida de destino que se va a predecir.

  1. Para datos de inductor de entrada futuros, seleccione Predecir valores de inductor de entrada que faltan si desea predecir valores en los que faltan valores de inductor de entrada.

    Los valores que faltan se predicen mediante la previsión estadística (predicciones univariadas) y se utilizan para el entrenamiento del modelo de ML.

  2. Para cada controlador, defina cómo gestionar los valores que faltan: haga clic en el icono Editar Icono Editaren la columna Acciones y, a continuación, en la lista Valores faltantes, seleccione una opción para gestionar los valores que faltan para el controlador.

    Los datos pueden contener valores que faltan por varios motivos, como fallos de medición, problemas de formato, errores humanos o falta de información. Puede definir cómo completar estos valores que faltan, lo que agrega valores estandarizados a las entradas que faltan en el conjunto de datos.

    • Ninguno: no realizar ninguna acción y enviar los datos tal cual.
    • Cero: reemplazar los valores que faltan para cualquier columna con cero.
    • Reemplazar por media: reemplazar por la media en toda la serie histórica.
    • Reemplazar por mediana: reemplazar por el punto de mediana de la serie histórica.
    • Reemplazar por modo: reemplazar por el valor más común en los datos históricos.
    • Reemplazar por el siguiente valor observado: reemplazar los valores que faltan por el valor observado en el siguiente período.
    • Reemplazar por el último valor observado: reemplazar los valores que faltan por el valor observado en el período anterior.
  3. Para cada inductor, en la lista Valores atípicos, seleccione la opción que desea utilizar para gestionar los valores atípicos, que son los valores que están fuera del rango mean +/- 3*Standard Deviation para el inductor:
    • Ninguno: no realizar ninguna acción y enviar los datos tal cual.

    • Reemplazar por cero: reemplazar por cero.

    • Reemplazar por media: reemplazar por la media.

    • Reemplazar por z_score: reemplazar por z_score.

      Para cualquier columna numérica, cualquier valor que se encuentre fuera de mean +/- 3*Standard Deviation (desviación estándar) se trata como un valor atípico. Un valor menor que mean - 3*std dev se reemplaza por mean -3*std dev. Un valor mayor que mean + 3*std dev se reemplaza por mean + 3*std dev.

  4. Haga clic en Siguiente.