Resampling: Wenn eine Stichprobe nicht genug ist, machen wir viele daraus.

Vertrau nie nur einer Stichprobe – resample und vergleiche.

Mister Asker

Resampling bezeichnet in der Statistik und Datenanalyse eine Gruppe von Methoden, bei denen aus einer gegebenen Stichprobe neue Stichproben erzeugt werden, um Eigenschaften von Schätzern oder Modellen zu beurteilen. Dabei wird das ursprüngliche Datenmaterial mehrfach zufällig oder systematisch neu angeordnet oder ausgewählt, um beispielsweise die Genauigkeit von Schätzungen zu bestimmen, Konfidenzintervalle zu erstellen oder Hypothesentests durchzuführen. Bekannte Resampling-Techniken sind das Bootstrapping, bei dem mit Zurücklegen Stichproben gezogen werden, und die Kreuzvalidierung (Cross-Validation), die vor allem in der Modellbewertung verwendet wird. Resampling spielt eine wichtige Rolle, wenn klassische theoretische Annahmen schwer anzuwenden sind oder die Stichprobe klein ist.