Preparação dos Dados

Defina como avaliar e gerenciar os dados antes de executar a predição, por exemplo, como tratar outliers ou valores ausentes. Essas opções para preparar os dados podem melhorar a qualidade dos dados usados para a predição.

Defina como gerenciar os dados de cada fator. Observe que o valor de Destino definido como Sim indica a medida de destino que está sendo prevista.

  1. Para dados futuros do fator de entrada, selecione Prever valores ausentes do fator de entrada se desejar prever valores onde os dados do driver de entrada estiverem ausentes.

    Valores ausentes são previstos usando previsão estatística (predições univariadas) e são usados para treinamento do modelo de ML.

  2. Para cada fator, defina como tratar valores ausentes: clique no ícone Editar Ícone Editarna coluna Ações e, em seguida, na lista Valores Ausentes, selecione uma opção para tratar valores ausentes do fator.

    Os dados podem conter valores ausentes por vários motivos, como falhas de medição, problemas de formatação, erros humanos ou falta de informações. Você define como preencher esses valores ausentes, o que adiciona valores padronizados a entradas faltantes no conjunto de dados.

    • Nenhum — Não execute qualquer ação e envie os dados como estão.
    • Zero — Substitua os valores ausentes de qualquer coluna por zero.
    • Substituir por Média — Substitua pela média em toda a série histórica.
    • Substituir por Mediano — Substitua pelo ponto mediano da série histórica.
    • Substituir por Modo — Substitua pelo valor mais comum nos dados históricos.
    • Substituir por Próximo Valor Observado — Substitua os valores ausentes pelo valor observado no próximo período.
    • Substituir por Último Valor Observado — Substitua os valores ausentes pelo valor observado no período anterior.
  3. Para cada fator, na lista Outliers, selecione uma opção para tratar valores de outlier, que são valores que estão fora do intervalo mean +/- 3*Standard Deviation do fator:
    • Nenhum — Não execute qualquer ação e envie os dados como estão.

    • Substituir por Zero — Substitua por zero.

    • Substituir por Média — Substitua pela média.

    • Substituir por Z_score — Substitua por z_score.

      Em qualquer coluna numérica, qualquer valor que esteja fora de mean +/- 3*Standard Deviation (desvio padrão) é tratado como um outlier. Um valor menor que mean - 3*std dev é substituído por mean -3*std dev. Um valor maior que mean + 3*std dev é substituído por mean + 3*std dev.

  4. Clique em Próximo.