O Bootstrap é uma técnica simples que estima a confiabilidade ou a precisão de estatísticas de previsão ou outros dados de amostra. Métodos clássicos contam com fórmulas matemáticas para descrever a precisão das estatísticas de amostra. Quando uma distribuição de amostragem estatística não é normalmente distribuída ou facilmente encontrada, esses métodos clássicos são difíceis de usar ou são inválidos.
O Bootstrap analisa as estatísticas de amostra obtendo repetidamente uma amostragem dos dados e criando distribuições das estatísticas diferentes de cada amostragem. O termo "bootstrap" vem do ditado, "erguer-se com seus próprios esforços" pois esse método usa a distribuição de estatísticas de si mesmo para analisar a precisão das estatísticas.
Dois métodos de bootstrap estão disponíveis com esta ferramenta:
Método de Uma Simulação — Simula os dados do modelo uma vez (cria a amostra original) e, em seguida, faz a amostragem repetidamente dessas avaliações de simulação (os valores de amostra originais). A re-amostragem cria uma nova amostra da amostra original com substituição. Ou seja, ela retorna o valor selecionado para a amostra antes de selecionar outro valor, permitindo que o seletor possivelmente selecione novamente o mesmo valor. Em seguida, ele cria uma distribuição das estatísticas calculadas de cada nova amostra. Esse método assume apenas dados de simulação originais que retrata com precisão a verdadeira distribuição de previsão, o que é provável se a amostra for grande o suficiente. Este método não é tão preciso quanto os métodos de várias simulações, mas ele leva significativamente menos tempo para execução.
Método de Várias Simulações — Repetidamente simula o modelo e, em seguida, cria uma distribuição das estatísticas de cada simulação. Esse método é mais preciso que o método de uma simulação, mas ele pode levar mais tempo.
Ao usar o método de várias simulações, a ferramenta temporariamente desativa a opção Usar Mesma Sequência de Números Aleatórios. Em termos de estatísticas, o método de uma simulação também é chamado de bootstrap não paramétrico, e o método de várias simulações também é chamado de bootstrap paramétrico. |
Como a técnica de bootstrap não presume que a distribuição de amostragem seja normalmente distribuída, você pode usá-la para estimar a distribuição de amostragem de uma estatística, até mesmo uma estranha, como o valor mínimo ou máximo de uma previsão. Você também pode facilmente estimar estatísticas complexas, tais como o coeficiente de correlação de dois conjuntos de dados, ou combinações de estatísticas, como a razão de uma média com uma variação.
Para estimar a precisão das estatísticas de Hipercubo Latino, você deve usar o método de várias simulações.