当前位置:  开发笔记 > 人工智能 > 正文

在scikit中的RandomForestClassifier与ExtraTreesClassifier学习

如何解决《在scikit中的RandomForestClassifier与ExtraTreesClassifier学习》经验,为你挑选了2个好方法。

任何人都可以解释scikit中的RandomForestClassifier和ExtraTreesClassifier之间的区别.我花了很多时间阅读论文:

P. Geurts,D.Ernst.和L. Wehenkel,"极度随机树",机器学习,63(1),3-42,2006

看来这些是ET的区别:

1)当在分割中选择变量时,从整个训练集中抽取样本而不是训练集的自举样本.

2)从每次分裂的样品中的值范围中完全随机地选择裂解.

这两件事的结果是更多的"叶子".



1> ogrisel..:

是的,两个结论都是正确的,尽管scikit-learn中的随机森林实现可以启用或禁用引导程序重采样.

在实践中,RF通常比ET更紧凑.从计算的角度来看,ET通常更便宜,但可以变得更大.ET有时可以比RF更好地推广,但是如果没有先尝试(和调整n_estimators,max_features以及min_samples_split通过交叉验证的网格搜索),很难猜测是什么时候.



2> Muhammad Uma..:

ExtraTrees分类器总是测试特征部分的随机分裂(与RandomForest相比,后者测试所有可能的特征分裂)


我很高兴这个评论从字面上是对Coursera测验问题的逐字回答
也来自同一课程。这个答案很有帮助!
推荐阅读
赛亚兔备_393
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有