0

集成学习——Bagging与Random Forest

前言

集成学习是一类算法的集合,不但包括著名的AdaBoost,还囊括提升树,梯度提升,Bagging以及Random Forest等。本文将介绍Bagging(装袋)与Random Forest(随机森林)。

要得到泛化性能强的集成,应该设法让集成中的基学习器尽可能具有较大的差异。给定一个训练数据集,我们采用相互有交叠的采样子集,每个采用子集训练得到一个集学习器,这样保证了集学习器能相互“独立”并且有比较好的学习性能。

本文主要内容为

  1. Bagging
  2. Random Forest

Continue Reading