randomforest随机森林 参数
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
randomforest随机森林参数
Random Forest(随机森林)参数
Random Forest(随机森林)是一种基于决策树的集成学习(ensemble learning)方法,通过构建多个决策树,将它们拼接在一起,从而形成一个强有力的、具有良好泛化能力的决策树模型。
它非常适合做分类和回归任务。
Random Forest有如下重要参数:
1. n_estimators:决策树的数量,即构建森林时使用的树的数量,默认值为10 。
2. max_features:决策树每次生成时,所使用的最大特征数量,默认值为None,也可以设置一个整数或者浮点数。
3. min_samples_split:决策树中每个节点最少需要分割的样本数,默认值为2。
4. min_samples_leaf:决策树每个叶子节点所需要的最少样本数,默认值为1。
5. max_depth:决策树深度,即从根节点到叶子节点的最大分入数量,如果为None,则节点的深度将不受限,默认值为None。
6. bootstrap:是否有放回的采样,默认值为True,即有放回采样。
7. criterion:决策树所使用的评价准则,默认值为“gini”,也可以选择“entropy”。
8. oob_score:是否使用袋外数据来估计泛化精度,默认值为
False,即不使用袋外数据。