Zunächst wird mithilfe des Bootstrapping-Verfahrens $B$ Stichprobenwiederholungen des Umfanges $n$ aus dem Originaldatensatz erzeugt und auf diesen werden dann $B$ Vorhersagemodelle $m_{i}$ ( $i=1,\dots ,B$ ) trainiert. Für einen Wert $x$ ergeben sich dann $B$ Vorhersagewerte $m_{i}(x)$ . Die Ergebnisse der Modelle werden dann mit einer Aggregationsfunktion (z. B. Mittelwert, Median, Majority Voting etc.) zusammengefasst:

Ist der Vorhersagewert eine Klassenzugehörigkeit, dann könnte die am häufigsten vorhergesagte Klasse als Vorhersagewert $m^{B}(x)$ genommen werden (Aggregierung über Majority-Voting)
Im Regressionsfall ergibt sich bei Aggregierung über den Mittelwert der Vorhersagewert als

m^{B}(x)={\tfrac {1}{B}}(m_{1}(x)+\cdots +m_{B}(x))

oder allgemein mit Gewichten

w_{i}

m^{B}(x)=w_{1}m_{1}(x)+\cdots +w_{B}m_{B}(x)

Bei einer Aggregierungsfunktion, welche die einzelnen internen Modelle gewichtet, könnten die Gewichte z. B. von der Qualität der Modellvorhersage abhängen, d. h. „gute“ Modelle gehen mit einem größeren Gewicht ein als „schlechte“ Modelle.

Vorgehensweise

Eigenschaften

Siehe auch

Einzelnachweise

Literatur