Stima della precisione dei dati con lo strumento Bootstrap

Il bootstrap è una semplice tecnica che consente di stimare l'affidabilità o la precisione delle statistiche di previsione o di altri dati campione. I metodi tradizionali si basano su formule matematiche per descrivere la precisione delle statistiche campione. Quando la distribuzione di campionamento di una statistica non è distribuita normalmente o non è facilmente individuabile, questi metodi classici sono difficili da utilizzare o non sono validi.

Lo strumento Bootstrap analizza le statistiche campione campionando ripetutamente i dati e creando distribuzioni delle diverse statistiche di ogni campionamento. Il metodo bootstrap utilizza la distribuzione delle statistiche per analizzare la precisione delle statistiche stesse.

Con questo strumento sono disponibili due metodi bootstrap:

Nota:

Quando si utilizza il metodo basato su più simulazioni, lo strumento disattiva temporaneamente l'opzione Usa stessa sequenza di numeri casuali. Nella documentazione relativa alle statistiche il metodo basato su simulazione singola è denominato anche bootstrap non parametrico, mentre il metodo basato su più simulazioni è denominato anche bootstrap parametrico.

Figura 9.10. Metodi di simulazione dello strumento Bootstrap

In questa figura sono visualizzati i metodi basati su simulazione unica e su più simulazioni

Poiché la tecnica bootstrap non presuppone che il campionamento sia distribuito normalmente, è possibile utilizzarla per stimare la distribuzione di campionamento di qualsiasi statistica, persino una non convenzionale come il valore minimo o massimo di una previsione. È inoltre possibile stimare facilmente statistiche complesse, come il coefficiente di correlazione di due set di dati, o combinazioni di statistiche, come il rapporto di una media rispetto a una varianza.

Per stimare la precisione di statistiche Ipercubo latino, è necessario utilizzare il metodo basato su più simulazioni.